点击上方蓝字可以关注哦!
本文引用信息
徐晓滨, 张明, 文成林, 韩德强, 黄大荣. 基于信度区间的故障特征约简方法[J]. 控制与决策, DOI: 10.13195/j.kzyjc.2017.1299.
基于信度区间的故障特征约简方法
徐晓滨, 张明, 文成林, 韩德强, 黄大荣
1
研究背景
故障诊断技术是工业设备稳定运行的重要保障。通过融合安装在设备上多个传感器获取的大量监测数据,给出更为可靠的诊断结果。但是融合过程往往计算量大,影响了诊断的实时性。此时,可以对故障特征进行适当的约简,利用重要的特征数据进行诊断,从而在保证较高确诊率的同时,兼顾诊断的实时性。
粗糙集是在保持信息系统分类能力的情况下,剔除冗余属性与数据。它直接对原始数据进行分析与推理,并从中发现隐含的知识。粗糙集理论能够有效地处理非精确、不确定以及不完备的数据,而属性约简是粗糙集中最重要的研究内容,其过程为:计算核属性集合,采用启发式算法向核属性集合中依次添加剩余属性,直至满足终止条件,得到属性约简结果。其中,启发式算法通常是利用基于属性重要性和属性频率的策略得以实现的。
Dempster-Shafer证据理论是另一种处理不确定信息的方法,它定义基本信度赋值函数(证据) 、置信函数以及似真函数,来度量信息的不确定性,并给出证据组合规则融合多个信息源提供的证据,形成了一套完备的不确定性推理理论与方法。粗糙集和证据理论在处理非精确和不确定信息时,两者研究的机理和方法各异,但具有相容性。粗糙集用基于知识库的一对上、下近似来描述信息,而证据理论则是用一对信任函数和似真函数对系统进行评估。可见,将证据理论引入粗糙集的研究中,有望给出知识发现的新机制。
2
主要工作
本文在深入分析两种理论关系的基础上,给出基于信度区间的属性约简定理。基于该定理,提出一种基于信度区间的故障特征属性的约简方法,主要分为以下三个步骤:
一是基于K均值和RFV的故障特征数据离散化。由于传感器采集的数据一般都是连续型实值,而粗糙集一般处理离散型属性,因此要对数据进行离散化处理,通过K均值算法可以初步划分故障特征数据;同时这些监测数据总是带有不确定性。不确定性影响因素主要来自两个方面:一是传感器工作时所受到的随机噪声干扰;二是传感器自身及其后续信号调理电路的系统性误差,因此在对故障特征数据进行离散化时,应该充分考虑这两个不确定性因素的区别,而RFV可以合理地表示测量不确定性中不同的影响因素,较为全面和自然地描述测量所具有的不确定性,通过RFV可以获取数据的离散信度表示,从而达到对数据的精细化离散处理,并得到如表1所示的决策信息系统。
表1 经离散化处理后的决策信息系统
二是基于压缩二进制矩阵的核属性求取。首先剔除重复样本,减少计算量,同时采用压缩二进制矩阵,可以有效地减少矩阵的存储空间。另外,在压缩二进制矩阵的构造过程中,通过将一致和不一致对象加以区分,并根据对应的条件构造矩阵中的元素,可以同时处理一致/不一致决策表,得到相应的核属性集。
三是基于信度区间的属性简约算法,将信度区间的宽度作为向核属性集中添加剩余属性的标准,信度区间宽度越小表示对所有Xn∈U/RD的可定义程度越高,当该信度区间宽度为0时,即表示其能完全定义U/RD中的集合,此时的核属性集为决策信息系统的属性约简结果。
3
局限及展望
本文算法的效果在电机转子试验台上得到了验证,主要分为离散化方法对比以及属性约简方法对比两方面。
为了说明本文所提离散化方法的有效性,这里与具有代表性的离散化方法进行对比,首先是方法一:传统基于K均值离散化方法(非监督离散化方法),方法二:利用信息熵计算断点来划分数据(有监督离散化方法)。同时,采用本文的约简算法得到属性约简结果,结果如下表所示:
表2 离散化方法对比
为了进一步说明本文算法的有效性,将所提算法与以下三种经典的粗糙集方法进行对比:方法A:基于属性频率的约简算法;方法B:基于属性重要度的约简算法;方法C:基于区分度和区分率的约简算法;这三种方法分别将属性频率、单属性的近似精度以及区分度和区分率作为迭代过程中属性选取的标准,结果如表3所示。
表3 粗糙集方法的性能比较
4
总结
针对故障诊断中故障特征数量过多会影响诊断时效性的问题,本文根据粗糙集上下近似与证据理论信度测度之间的联系,提出了基于信度区间的属性约简定理,即属性约简结果能对所有决策等价类完全定义,且该结果的信度区间宽度为0,并在该定理的基础上给出了一种基于属性信度区间的故障特征约简方法,来满足诊断的实时性需求。利用K均值和RFV对故障特征数据的进行精细化离散处理,获得决策信息系统;再构建压缩二进制矩阵快速得到核属性集;最后计算剩余属性的信度区间,并将具有最小信度区间的属性添加至核属性集,直至满足终止条件,得到属性约简结果。通过电机柔性转子故障诊断实验表明,该属性约简方法效果较好,不仅能提高属性约简过程的效率,同时根据约简后的属性进行故障诊断,能大幅减少诊断时间,保证故障诊断的实时性。
作者介绍
徐晓滨,杭州电子科技大学自动化学院教授,硕士生导师,主要从事智能信息融合与复杂系统可靠性评估、故障诊断与预测研究。
张明,杭州电子科技大学自动化学院硕士研究生,主要研究基于证据理论的故障诊断。
文成林,杭州电子科技大学自动化学院教授,博士生导师,主要从事多源网络信息融合理论与方法,多目标跟踪理论,复杂系统/设备故障诊断等研究。
郑重声明:根据国家版权局相关规定,纸媒、网站、微博、微信公众号转载、摘编本微信信息,需包含本微信名称、二维码等相关信息,并在文首注明《控制与决策》原创。个人请按本微信原文转发、分享。
关于《控制与决策》
网站:
http://kzyjc.alljournals.cn
电话:
024-83687766
邮箱:kzyjc@mail.neu.edu.cn
公众微信号:CD_1986neu
点击阅读原文查看全文信息