当前位置 首页 >报告诀窍 >

基于超限学习机的95598故障工单预测模型研究

作者:jkyxc 浏览数:


打开文本图片集

【摘 要】对95598客服中心接到的工单数据进行分析,结合往年同期温度、降雨量、极端天气、节假日等外部因素,利用超限学习机训练得到95898故障工单预测模型,从而可以提前布置抢修队伍、抢修车辆、抢修物资的合理化安排,从而综合提升95598工单精准服务。测试实验表明,该预测模型的预测精度能达到85%以上。利用该模型,能够有效地实现故障报修服务的事前管控。

【关键词】95598客服;故障工单;超限学习机;加权超限学习机;预测模型

中图分类号: TM911.4 文献标识码: A 文章编号: 2095-2457(2019)31-0034-002

DOI:10.19694/j.cnki.issn2095-2457.2019.31.014

95598是全国电力系统公用的客服电话,属于呼叫中心的一种,是目前國内最好的服务热线之一。服务热线95598,主要功能是受理客户的故障报修、业务咨询、信息查询、投诉、举报、建议、意见等七大类,是供电公司营销体系的重要组成部分。95598利用电话平台,建立“一口对外”的客户服务中心,为电力企业与用户之间建立起直接的沟通渠道,为电力客户提供快捷、优质的服务。缩短了供电企业与客户在时空上的距离、对外提高供电公司的客户服务水平,树立专业、高效的良好社会形象,对最终创建全国乃至世界一流的供电企业做出了重要的贡献[1]。

95598收集到的客户信息涵盖了国网向客户提供的所有服务,通过客户的来电可以全面了解客户需求及关心的所有热点、难点问题[2]。以浙江省丽水市为例,近期某个样本时间段内95598工单数26937件。其中,故障工单数19710件,投诉、咨询、举报、表扬、建议、意见、服务申请等非故障工单数7227件。可见,故障工单数在总工单数中的占比是最高的。

此外,由于目前故障报修采用直派流程方式,故障服务热点分散在不同类型的95598工单中,无法快速反应当前供电服务的热点问题,同时95598工单依赖人工统计分析,导致不能及时发现处理一些服务热点问题,并且,依靠人工统计分析95598工单的数据有局限性和带有主观性。因此,有必要将数据进行整合分析,利用以往数据建立故障工单预测模型,实现故障报修服务的事前管控。

目前,故障工单预测模型的研究并不多见,文[3]设计了一种多元线性回归模型来预测故障工单数,但实际上,并没有研究表明,故障工单数与相关因素是线性回归的关系,因此本文利用超限学习机算法进一步对故障工单预测模型进行研究。

1 超限学习机

由于单隐层前馈神经网络(Single-hidden layer feedforward network,SLFN)能够逼近任何非线性模型,且逼近效果好,速度快,这使得单隐层前馈神经网络在目标识别、样本分类、自动控制等许多研究和应用领域得到了广泛的应用。

图1为一个单隐层前馈神经网络。

图1 单隐层前馈神经网络

最近几年,新加坡南洋理工大学的黄广斌教授提出了一种称为“超限学习机(Extreme Learning Machine,ELM)”[4]的单隐层前馈神经网络学习算法,在该算法中,模型的隐层权和偏差为随机设置,然后利用最小二乘法计算得到外权矩阵,训练过程为直接法,并不需要反复迭代和更新。与已知的其他神经网络算法,譬如BP算法以及支持向量机等方法相比,简单高效且泛化性能好等特点。超限学习机理论最近也得到了生物和脑神经学的直接生物验证,弥补了机器学习和脑学习机制之间的空白,解决了计算机之父冯·诺依曼60年前的关于人脑和计算机结构和能力的困惑。现在超限学习机已经被广泛应用在模式识别、模式分类、预测等当中[5-6]。

超限学习机算法中,设输入样本为x,则其隐层输出的形式表现为一个向量h(x)=[h1(x),h2(x),…,hL(x)]对于给定的N个训练样本(xi,ti)学习机的数学模型为:

Hβ=T(1)

其中H为隐层输出矩阵,β为输出权矩阵,T为目标矩阵,其中:

■(2)

利用正交投影法计算H的广义逆后可得:

当■时,

β=H■(HH■)■T(3)

当N>1时,

β=(H■H)■HTT(4)

为了进一步提高超限学习机的泛化性能,文[7]引入了一个正数C,将(3)式和(4)式分别修正为,

β=H■(■I+HH■)■T(5)

当N>L时,

β=(■I+H■H)■H■T(6)

其中I为N阶单位矩阵.

当超限学习机作为预测算法使用时,期望输出向量ti可按照实际情况定义为实数、向量或者矩阵。

2 故障工单数据的获取与分析

与故障工单数相关的分析数据有气象数据、极端气候数据、节假日信息、月份信息等数据信息。分别从95598系统、丽水统计局网站、中国天气网、丽水水文信息网等途径收集数据。

首先对数据进行预处理。

第一步:剔除重复数据或者适当加入噪声数据,避免出现过拟合训练数据的情况。

第二步:利用热卡填充的方法,对缺失数据进行填充,使得数据得以有效使用。

第三步:剔除异常点和强影响点。异常点是远离数据集合中心的数据点,强影响点是数据集中的那些对统计量或参数的估值结果有非常大的影响力的数据点,通过剔除这些点,可对预测模型进行改进。

3 故障工单数预测模型

实验中使用的仿真软件为:Matlab R2017b。实验的环境为: Window 10 64位操作系统,Intel Core i3-6100 3.70GHz,8GB内存。

输入样本属性为5个,分别为气温、降水量、极端天气、月份、节假日。其中,12、1、2月的气温数据采用每日最低温度值,3、4、5、9、10、11月的气温数据采用每日平均温度值,6、7、8月的气温数据采用每日最高温度值。降水量按气象学上的降水等级划分小雨、中雨、大雨、暴雨、大暴雨分别对应取值1、2、3、4、5。极端天气主要考虑台风、雷暴、雪,按照严重程度分别对应取值1、2、3。月份信息12、1、2对应数值1,3、4、5、9、10、11月对应取值2,6、7、8月对应取值3。节假日信息中,节假日对应数值1,非节假日对应数值。以丽水市2018年的365天对应生成365个输入样本数据,对应的365个故障工单数作为输出数据。同时,生成已经过去的2019年上半年丽水市的输入样本数据和输出数据。对输入数据进行标准化。

预测模型采用的激励函数为Logistic函数f(a,b,x)=■;(5)式和(6)式中的参数C与单隐层节点个数L的取值采用grid搜索法,C的搜索范围为2■,2■,…,2■,2■,L的搜索范围为15,25,…,625,635。

对于测试集的预测值,如果预测的故障工单数和当天实际的故障工单数的误差小于等于5,被认为是有效预测,否则为无效预测。

实验中对于2018年的数据集采用5-折交叉验证,运行50次。

经过验证,2018年的故障工单数的有效预测率达到了85%以上,2019年上半年的故障工单数的有效预测率达到了80%以上,说明该预测模型能够满足电网运监对于故障工单数进行监控工作的实际需要。

4 小结

本文以国网丽水供电公司为例,对95598客服中心接到的故障工单数据进行分析,首先对数据进行预处理,然后利用超限学习机训练得到一种故障工单预测模型,该预测模型训练速度快,泛化性好,有效预测率达到了85%以上。利用该模型,能够有效地实现故障报修服务的事前管控,帮助提高运监部门的工作效率。

【参考文献】

[1]田媛,试论如何提高95598电力客户服务工作[J].中国市场,2013(45):36-37.

[2]程超,张凯,程慧,95598系统数据的分析方法及其应用[J].河北电力技术,2015,34(3):37-38.

[3]董知周,陈显辉,吴海峰,等,基于大数据的配电网抢修工单分析与预测研究[J].供用电,2018,35(4):60-67.

[4]HUANG G B,ZHU Q Y,SIEW C K, Extreme learning machine: Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.

[5]盧诚波,梅颖.前馈网络的一种高精度鲁棒在线贯序学习算法[J].上海交通大学学报(自然版),2015,49(08):1137-1143.

[6]梅颖,卢诚波.面向不平衡数据流的自适应加权在线超限学习机算法[J].模式识别与人工智能,2019(2),144-150.

推荐访问:超限 学习机 模型 故障 预测

相关文章:

Top