振动信号的特征提取

首页    技术性文章    振动信号的特征提取

1、什么是信号特征?

首先,针对常用的信号特征这个问题,任何能区分目标信号和其他信号的“描述”都能当作目标信号的特征。特征本质就是对一类信号“样貌”的“描述”。信号可以从“均值”、“方差”、“有效值”、“频率”的角度描述信号的“样貌”。“特征”本身最重要的含义是“事物异于其他事物的特点”。一个事物(这里可以直接认为是信号)的描述有很多,但是真正能称得上特征还必须具备一定的条件,那就是“差异性”。因此特征是“考虑任务场景,且具有事物区分度的描述”。这里引用机械故障诊断领域先驱Simon Braun教授关于“机械特征分析”的定义来说明这个问题:“机械特征分析”-机械设备异常状态导致的振动特征能很容易地同健康状态下的参考特征区分开来,上面这句话考虑的场景是“基于振动的机械设备异常分析”,“健康状态下的参考特征区分开来”是对“事物区分度”的表述。

2、特征提取手段有哪些?
(1)“机器学习”技术可以是一种特征提取手段。“机器学习”能用来提取特征,典型的就是“神经网络”和“机器学习”,这类方法学习到的特征具有很强的针对性,特定适用于这个任务。
(2)另一种就是专家直接总结经验,让一些已经知道的人直接根据经验去总结。数学上,经验的总结一般用数学公式来描述,如“均值”,“方差”等等,可以从他们的定义看出,这一般都是基于一些统计手段进行描述。现实中,这些统计的描述太过宽泛,因此我们并不知道这些描述能不能用于我们特定的任务。所以我们在使用现成总结好的特征时往往需要有一个“特征筛选”过程,人为的筛选出一些适用的“描述”作为特征。第二种特征提取方法本质上是人为经验的数学总结(主要适用统计手段)。当然还有一类看是文字描述,本质还是适用数学手段描述的人工经验指标。比如,EMD(经验模态分解)对它想要得到的信号的“特征”描述是:IMF(固有模态函数)的定义⑴函数在整个时间范围内,局部极值点和过零点的数目必须相等,或最多相差一个; ⑵在任意时刻点,局部最大值的包络(上包络线)和局部最小值的包络(下包络线) 平均必须为零,很显然这两句话依然是对要区分的信号的特征描述。在实际操作过程中,EMD通过“EMD迭代筛分步骤”实现这个特征,最终从一个复杂信号中提取出所有和定义“特征”相符的信号。所有的信号分析和处理都是在做“特征”分析。不仅仅是“故障诊断”、“语音识别”等耳熟能详的任务。
举例:小波分析将信号分解为和小波基相似的信号,因此给定的这个小波基函数就是一个“特征”的描述,要求分解的信号要和给定的这个基函数一样。傅立叶分析定义的信号的特征就是“频率”,他将信号分解为“频率”不一样的组合。PCA(主成分分析)使用“方差”作为区分信号特征,将信号分解为多个“方差”不同的信号。所以所有信号分析方法背后的本质都有一个“特征”作为目标的指导。
3、选择哪些信号特征进行信号识别?
实际上,选择哪些特征主要取决于任务。因为即使直接使用现成总结好的特征,依然面临一个问题“特征筛选”,这个问题非常常见。最简单就是根本不对特征进行选择,让神经网络自己去挑选有用的特征(通过网络权重大小决定特征的重要性)。这中策略“非常简单”,缺陷就是无用特征太多,网络结构太大,难以训练,最后“机器学习”的结果可能不是很满意。
另一种就是使用一些技术对选择的特征进行“压缩和筛选”,得到最有差异和富有“信息”的特征,再用这些特征进行学习,这样网络较小,训练相对容易,可以提高“机器学习”的性能。但是这些压缩技术或筛选技术依然有人为经验的参与,比如基于距离信息的筛选原则,就是利用了人为经验“距离是评估特征好坏的判断准则”。如果我们能很好解决大型神经网络的训练问题,实际上第一种策略是一种万能方法,因为所谓的压缩和特征筛选可以用前几层神经网络训练(这里解释一下,神经网络本身能逼近任何函数映射,而人为选择的流行学习或PCA等方法本身就是可以用神经网络等效实现的)。当然另一种技术就是完全使用机器学习技术,将特征层也用神经网络实现,最终生成一种端到端的模型,这个网络要完成的功能非常多,特征表示、特征筛选压缩、分类和回归等,这样的网络会非常深,简称为“深度神经网络”。“选择哪些信号特征进行信号识别?”,不好确定,因为没有一个具体的任务就无法确定“好的特征”。
供参考的特征参数:
1)拿到时间域一维信号,简单统计和运算可以得到的特征有:均值,方差,均方根,峰值因子,峭度系数,波形因子,裕度因子、脉冲因子;
2)估计-分布参数一般服从某一类分布;
3)频域:特征频率,均方频率,重心频率,频率方差;
4)小波方法提取的系数,小波滤波后的特征频率等;
5)信号熵,谱熵,排列熵,小波熵,EMD熵,包络谱熵等;
6)谱峭度,快速谱峭度、小波谱峭度等;
7)基于数学工具和降维的特征,如PCA,矩阵特征向量,矩阵的秩,特征根,SVD-奇异值、ICA等;
8)一些基于距离的度量、范数、马氏距离、分形参数,同胚流行等;
9)任何能表征信号特征的自定义参数均可以,有时是结合实际需求的。

几十年来,故障诊断出了现了很多优秀的算法,最实用的还是时域指标监测、fft、包络谱这几个。深度学习在工业界应用了至少8-9年了,数据赋能到现在,主要还只是停留在实验室阶段。真正的工业数据,基本上很难去做,深度学习的泛化性能几乎无法保证。

2023年3月1日 15:20
浏览量:0
收藏