
技术摘要:
本发明公开了一种基于改进多尺度散布熵的大地电磁信号去噪方法及系统,该方法包括:步骤S1:将大地电磁信号分段,再分别提取每段大地电磁信号的改进多尺度散布熵;步骤S2:利用每段大地电磁信号的改进多尺度散布熵进行聚类分析识别出强干扰信号段和低频缓变化信号段; 全部
背景技术:
大地电磁(MT)是一种基于电磁感应原理的电磁测深方法,通过利用在地面上观测 具有区域性乃至全球性分布特性的天然交变电磁场来研究地下岩层的电性及分布特征。由 于天然场中含有从高频到低频丰富的频率成分,而不同频率成分的电磁波具有不同的趋肤 深度,因此大地电磁法能达到测深的目的。然而,一种天然交变电磁场做场源的方法与有源 场相比,其信号微弱、频带宽,在野外数据采集中易受到噪声的干扰。如何高效压制噪声,提 高大地电磁数据的信噪比,保证数据质量,始终是MT数据采集和处理的核心问题。 伴随着电子技术,信号处理技术的发展而迅速推广,大地电磁测深无论在仪器研 制,数据采集,处理技术与反演解释的研究都融合了当今最新的科学理论和高新技术。如远 参考法、robust估计、小波变换、数学形态滤波、压缩感知、稀疏分解、信噪辨识等均在MT数 据处理中得到较好地应用,一定程度上提高数据的信噪比和质量。然而,上述方法在处理MT 噪声信号时,往往丢失低频有用信息或处理效率低等问题,造成视电阻率-相位曲线严重混 乱,导致数据质量严重降低,无法为后续电磁法反演提供有效可靠的大地电磁测深数据。
技术实现要素:
本发明的目的是提供一种基于改进多尺度散布熵的大地电磁信号去噪方法及系 统,从大地电磁时间序列入手,提取每段大地电磁信号的改进多尺度散布熵作为特征,再利 用特征参数进行聚类分析,自动识别出强干扰信号段和低频缓变化信号段,然后仅对强干 扰信号段进行针对性去噪,将去噪后的信号段和识别为低频缓变化信号段合并来重构高质 量的大地电磁信号,解决了现有技术在去噪中的过处理和处理不当等问题。本发明算法简 单,易于实现,适合于处理海量受方波和三角波强干扰的实测大地电磁数据。 本发明提供的一种基于改进多尺度散布熵的大地电磁信号去噪方法,包括以下步 骤: 步骤S1:将大地电磁信号分段,再分别提取每段大地电磁信号的改进多尺度散布 熵; 其中,将一段大地电磁信号在尺度因子τ下进行多尺度粗粒化处理得到τ组粗粒化 序列,再统计尺度因子τ下粗粒化序列的散布模式概率的均值,并结合香农熵定义和所述散 布模式概率的均值得到所述一段大地电磁信号的改进多尺度散布熵。 其中,将原始的大地电磁信号X分为n段,X={Xi,i=1,2,...,n},Xi表示第i个信号 段,再分别计算每一段大地电磁信号的改进多尺度散布熵; 步骤S2:利用每段大地电磁信号的改进多尺度散布熵进行聚类分析识别出强干扰 信号段和低频缓变化信号段; 4 CN 111597981 A 说 明 书 2/8 页 步骤S3:对所述强干扰信号段进行去噪; 步骤S4:将步骤S3中去噪后的信号段与低频缓变化信号段进行合并拼接得到重构 的大地电磁信号。 其中,所述改进多尺度散布熵的公式如下: 式中,m表示嵌入维数,c表示类别个数,d表示时延,Xi表示第i段大地电磁信号,1 ≤i≤n,n为待去噪的大地电磁信号分段后的总段数; 表示尺度因子为τ时的第k个粗粒化 序列,IMDE(Xi,m,c,d ,τ)表示嵌入维数m、类别个数c、时延d、尺度因子τ确定时第i段大地电 磁信号Xi对应的改进多尺度散布熵; 表示散布模式, 表示尺度因子τ下 的粗粒化序列的散布模式概率的均值, 表示一个粗粒化序列 对应的一种散布 模式 的概率,cm表示散布模式的总个数,D=1表示第一个散布模式,v0v1...vm-1分别 对应嵌入向量中的m个元素值,嵌入向量是由粗粒化序列 转换而来。 本发明针对大地电磁信号中的方波干扰和三角波干扰,巧妙地选用改进多尺度散 布熵作为特征输入聚类分析,达到自动识别低频缓变化信号段(有用信号段)和强干扰信号 段(噪声段)的目的,随后将识别为大地电磁强干扰信号段进行正交匹配追踪剔除噪声,并 与有用信号段进行合并得到重构的大地电磁信号,进而有针对性地压制了大地电磁信号中 的噪声干扰,保留了大地电磁有用信号,避免了现有技术进行整体处理时丢失的部分有用 信号和现有技术在多特征提取及聚类或分类时的效率问题。 其中,本发明所选用的改进多尺度散布熵是将原始信号进行粗粒化处理,再统计 粗粒化序列的散布模式概率的均值,并基于多尺度过程结合香农熵定义计算出的散布熵。 其一方面,改进多尺度散布熵利用尺度因子下粗粒化序列的散布模式概率来计算均值,能 有效地减少熵值随着尺度因子的增大而引起的波动,提高了多尺度分析的稳定性,减小计 算偏差,另一方面,选用改进多尺度散布熵是从大地电磁时间序列的复杂性和不规则程度 特征考虑的,改进多尺度散布熵越大,表示的混乱程度越高,更能反映强干扰信号段的不规 则程度。然而,提取大地电磁数据特征是基于多尺度下粗粒化过程时对散布模式概率计算 均值,并随着尺度的变化,本发明的特征参数值更加稳定,因此,本发明选用的改进多尺度 散布熵特征能更加精细地描述大地电磁信号与噪声,提高MT数据的稳定性及计算特征时的 效率。 进一步优选,嵌入维数m的取值范围为:[2,3],类别个数c的取值范围为:[4,7],时 延d的取值范围为:[1,3],尺度因子τ的取值范围为:[2,7]。 进一步优选,将一段大地电磁信号在尺度因子τ下进行多尺度粗粒化处理得到τ组 粗粒化序列的过程为:所述τ组粗粒化序列中第k个粗粒化序列 表示为: 分别为粗粒化序列 中的第一个、第二个元素; 5 CN 111597981 A 说 明 书 3/8 页 式中, 表示粗粒化序列 中的第j个元素,xi表示所述一段大地电磁信号中第i 个信号,N表示所述一段大地电磁信号的长度,即第i个信号段Xi的长度为N。 进一步优选,步骤S3中采用正交匹配追踪算法对所述强干扰信号段进行去噪; 其中,所述正交匹配追踪算法中过完备原子库包含了Fourier原子库和小波原子 库,原子设定为正余弦原子和小波原子。 其中,Fourier原子库是简谐三角函数,表示傅里叶变换中的基,对简谐信号匹配, 该原子由频率f和相位 两个参数决定,当相位分别为0和1时就是余弦原子ar=cos(2πft) 和正弦原子ar=sin(2πft);小波原子库基于小波函数,通过离散尺度参数和时间平移参数 来构建过完备原子库。 进一步优选,采用正交匹配追踪算法对所述强干扰信号段进行去噪的过程如下: 步骤S3.1:构建过完备原子库Γ; 步骤S3.2:从过完备原子库Γ的原子库中任意选择第r个原子,并对所选原子进行 正交化处理; 步骤S3.3:利用正交化处理后的原子更新原子集合,初始的所述原子集合为空集; 式中,φn、φn-1分别表示第n次、第n-1次稀疏分解的原子集合, 表示当前第n次稀 疏分解中步骤S3.2所选的正交化处理后的原子; 步骤S3.4:利用最小二乘法计算投影系数bn,再利用投影系数bn与更新的原子集合 φn相乘获得重构信号,并利用重构信号更新残差信号: 式中,b 表示当前第n次稀疏分解对应的投影系数,Rn-1 nn 、R 分别表示第n-1次、第n次 稀疏分解对应的残差信号,初始残差信号R0为所述强干扰信号段f, 表示当前第n次 稀疏分解对应的重构信号,T表示转置; 步骤S3.5:判断更新的残差信号与所述强干扰信号段f的能量比是否小于预设阈 值或者当前迭代次数是否达到最大迭代次数,若能量比小于预设阈值或当前迭代次数达到 最大迭代次数,当前更新的残差信号为所述强干扰信号段f去噪后的信号;否则,返回步骤 S3.2进行下一次的稀疏分解。 进一步优选,步骤S2中采用模糊C均值聚类方法进行聚类分析。 模糊C均值聚类通过利用隶属度来确定每个特征参数与聚类中心的欧式距离,并 划分聚类结果,从而识别出大地电磁噪声段和大地电磁有用信号段,为后续剔除识别为大 地电磁噪声段提供针对性处理。 另一方面,本发明提供的一种基于改进多尺度散布熵的大地电磁信号去噪系统, 包括: 特征提取模块,用于将大地电磁信号分段,再分别提取每段大地电磁信号的改进 多尺度散布熵; 6 CN 111597981 A 说 明 书 4/8 页 聚类分析模块,用于利用每段大地电磁信号的改进多尺度散布熵进行聚类分析识 别出强干扰信号段和低频缓变化信号段; 去噪模块,用于对所述强干扰信号段进行去噪; 信号拼接模块,用于将去噪后的信号段与低频缓变化信号段进行合并得到重构的 大地电磁信号。 有益效果 1、本发明提供了一种基于改进多尺度散布熵的大地电磁信号去噪方法及系统,通 过提取大地电磁信号的改进多尺度散布熵经过聚类分析进行信号与噪声的识别,将识别为 大地电磁噪声段进行针对性去噪处理,将去噪后的信号段与识别的有用信号段进行合并得 到重构大地电磁信号。本发明不仅能保留识别为大地电磁信号段,而且去噪更有针对性,其 重构结果改善了大地电磁低频段的数据质量,更为真实地接近天然大地电磁场源数据,能 为后续电磁法反演提供可靠的大地电磁测深数据,进一步为高精细的大地电磁强干扰压制 提供了新的技术支持; 2、本发明将改进多尺度散布熵作为输入聚类分析中的特征参数,改进多尺度散布 熵是先将原始信号进行粗粒化处理,再统计多尺度下粗粒化序列散布模式概率的均值,并 结合香农熵定义计算散布熵。改进多尺度散布熵利用尺度因子下粗粒化序列的散布模式概 率来计算均值,能有效地减少熵值随着尺度因子的增大而引起的波动,提高了多尺度分析 的稳定性,减小计算偏差。进一步从熵的理论特性结合大地电磁信号特征,信号熵值越大, 其混乱程度越高,该特征能反映大地电磁时间序列的复杂性和不规则程度。本发明的特征 参数值较多尺度熵值和多尺度散布熵值更加稳定,在大地电磁信号特征提取中更具优势。 本发明仅利用改进多尺度散布熵特征提高了MT数据特征参数的稳定性及计算效率,能更为 精细地描述大地电磁信号与噪声; 3、进一步优选方案中选用正交匹配追踪算法对强干扰信号段进行去噪,且是运用 Fourier原子库和小波原子库来构建过完备原子库,并使用通用性较强的正余弦原子和小 波原子进行高精度地匹配大地电磁强干扰信号,将所有选中的原子进行正交化,改进了原 始匹配追踪算法,并提升了收敛速度及计算效率。 附图说明 图1为本发明所述去噪方法的流程图。 图2为样本库信号不同特征参数对比,其中,(a)图中对应熵值为多尺度熵,(b)图 中对应熵值为多尺度散布熵,(c)图中对应熵值为改进多尺度散布熵。 图3为样本库信号通过提取改进多尺度散布熵特征经模糊C均值聚类的效果。 图4为模拟原始Blocks含噪信号的去噪效果,其中,(a)图为匹配追踪去噪效果, (b)图为正交匹配追踪去噪效果。 图5为实测大地电磁信噪识别及针对性去噪效果,其中,(a)图为实测大地电磁类 方波干扰MT信号,(b)图为实测大地电磁类充放电三角波干扰MT信号。 图6为本发明方法处理前后大地电磁(MT)测点的视电阻率-相位曲线对比图,其 中,(a)图为原始MT测点的视电阻率-相位曲线,(b)图为本发明方法处理后MT测点的视电阻 率-相位曲线。 7 CN 111597981 A 说 明 书 5/8 页