您好,欢迎来到步遥情感网。
搜索
您的当前位置:首页基于二进制时频掩码和ICA的欠定语盲分离

基于二进制时频掩码和ICA的欠定语盲分离

来源:步遥情感网
维普资讯 http://www.cqvip.com 第20卷第4期 聊城大学学报(自然科学版J VoI_20 NO.4 2007年12月 Journal of Liaocheng University(Nat.Sci.) Dec.2007 基于二进制时频掩码和ICA的欠定语盲分离 杜 军 (”山东大学信息科学与工程学院,山东济南,250100; 山东师范大学传播学院,山东济南250014) 摘 要 研究基于二进制时频掩码和ICA的欠定语音盲分离.首先对混叠语音进行时频变换;然 后利用二进制时频掩码技术从混叠信号的时频信息中消除掉一个源信号,将欠定的盲源分离问题 转变成正定的盲源分离;最后,将消除后的混叠信号变换回时域,再利用ICA技术进行分离.利用 本方案进行欠定语音分离,可以大大消除因二进制时频掩码带来的音乐噪声,能够达到很好的分 离. 关键词二进制时频掩码,ICA,欠定语音盲分离,音乐噪声 中图分类号TN912.3 文献标识码A 文章编号 1672—6634(2007)04—0088—04 0 引言 近年来,时频变换域盲源分离的研究越来越多,利用时频分析技术对混叠信号的时频分布进行分析, 从中分离出源信号的时频信息,从而达到盲源分离的目的[1 ].经典的ICA也可以应用到时频域中来进行 盲源分离,可以达到很好的效果,但同时还存在各个时频块上的尺度(scaling)和置换(permutation)问题, 使得算法变得较为复杂. 由于语音信号经过频域变换或时频变换后,其稀疏性要比在时域中强.混叠信号经过线性时频变换如 STFT、小波变换、小波包变换后,既不会改变原来的混叠方式,又使得其稀疏性更强,更利于分析,所以结 合时频分析技术进行欠定的盲源分离[s,63是一个很有效的途径. 二进制时频掩码技术(Binary Time—Frequency Masking,BTFM)[ 最早是一种应用于单通道信号分 离的有力工具,即可以从一个混叠信号中分离出多个源信号.该技术就是在时频域对稀疏信号进行分析, 如果各个源信号经过混叠后它们的时频信息是无交叠的,我们就可以使用二进制时频掩码来把属于同一 个源信号的时频分量提取出来,从而恢复出源信号.但二进制时频掩码也存在着产生音乐噪声、抗噪声能 力差等缺点. 1系统模型及框图 为了便于分析,本方案考虑下式的混叠模型: l( )一5l( )+s2( )+s3( )+,2l( ), , 2( )一口lSl( )+口2S2( )+口3S3( )+,22( ), 式中,源信号个数 一3,混叠信号个数 一2. ( )的混叠以 ( )为参考.经过线性时频变换后的混叠模型 可以写成 酸 (r, ).J— n n。]-j (2) 山东省自然科学基金项目(编号:y2005G21) 收稿日期:2007—06—08 维普资讯 http://www.cqvip.com

第4期 杜 军:基于二进制时频掩码和ICA的欠定语音盲分离 89 噪;声 项为零.本方案主要分两步,如图 所1 虑示.躁士’则圳 L’]\/L竺墨 .薄壁 卜毒 (f) 第一步,对时频域混叠信号加上二进制时频掩码消 入 后的混叠信墨号反变 换回时域,’.驾利用。  Fa stI.C第A 算法进行盲。 L-_J L匿崩 二 J u f) == ~ 分离,得到源信号估计;:, A .由于二进制时频掩码引入 图1系统框图 了音乐噪声,上述过程的 (r, )不能作为对 的估计,所以又重新进行了上述过程,在第一步中,消除 的时频分量.这样最后得到的就是 和 :的估计 和 .这样既消除了音乐噪声,又得到了源信号的估计. 2基于二进制时频掩码和 的欠定语音盲分离算法 2.1利用二进制时频掩码消除一个源信号 假设对混叠信号进行STFT变换,则在某一个时频窗(0, )上,由(2)式可得 一21 71(rj ' I) 一 1 '  ̄-0k )十 黉 2 L ' )十 3 L '  ̄-01, ㈣ 口(r,, I)称为混叠信号的时频比率(Time—Frequency Ratio of Mixtures,TIFROM).如果在此时频窗上, 只有源信号S 非零,则有a(rj,C.Ok)一 据此,在时频比率图上,可以根据这些值来创建以下掩码 Mi(Tj c.ok ={0  一 m ’ ㈤ 则消除掉S 后的混叠信号为 l(rj, )一 (r , )茔l(rj, ), 2(rj, ̄-0k)一 (rj, I) 2(rj,C-Ok), 然后再进行反变换得到 Yl(f):ISTFT[)l(rj, )], Y2(f)=ISTFT[)2(rj,C.Ok)], 这样就得到了只剩两个源信号混叠而成的混叠信号了. 2.2利用FastICA算法估计剩余两个源信号 FastICA算法 。 的关键步骤就是分离阵的迭代更新,基本步骤如下(设观测矢量Y已预白化): '.,,(五+1)=E{yg(w (五) Y))一E ('., (五) Y))'., (五), , (五+1)=Wi*(五+1)/lI'., (五+1)lI, 其中’‘, 为分离矩阵w的列矢量,函数g(・)为任意非线性奇函数,g (・)为其导数,初始权矢量'.,由随机选 取产生.定义g(・)一G (・),G为一任意的非二次函数, 收敛即可得到相应的分量.FastICA分离 中,合适的函数G可以使估计结果更好,由于语音信号具有超高斯分布的特点,且鲁棒性要求较高,根据文 献E8-1中对G的分析,我们选择 G( )一一exp(一n /2)/a, (8) 相应地 g( )一uexp(一口 /2), (9) 式中取a一1.迭代过程采用Gram—Schmidt标准正交化方法进行去相关 ],假设已经估计出了 ,…, 则 运行基本的FastICA算法得到 + ,然后:(1)令 + = + 一∑ '.,丁+ '., '., ;(2)令 + 一Wp+l/ √ '., + .这样依次求出'., ,'.,:,…,'., ,从而得到各个语音源信号.由FastICA算法可得到剩余源的 估计为: 一 (f)=聊(f) 2.3估计全部源信号 维普资讯 http://www.cqvip.com 90 聊城大学学报(自然科学版) 第2O卷 由以上算法可知,本方案至少要执行两次才能把全部三个 源信号估计出来.总体算法描述为:(1)将混叠信号z。(f),z (f) 变换到时频域.(2)计算混叠信号的时频比率a(ri, ).(3)统 计时频图上具有相同 ( , )的点的个数C( ),并求出C( )的 三个极值作为三个nr的值.(4)选定一源信号作为消除对象,建 立二进制时频掩码肘 (rj, ).(5)对混叠信号进行掩码计算,得 到消除后的混叠信号.(6)对消除后的混叠信号进行反变换得 到Yl(f),Y2(f).(7)对Yl(f),Y2(f)进行FastICA算法,得到剩余 两个源信号的估计.(8)再选定一个源信号作消除对象,重复进 行4~7步,得到全部源信号的估计. 图2三路原始语音S1,s2,s3(由上往下) 3实验结果及分析 50 原始语音如图2所 示,来自TIMIT语音数 据库,采样频率为8 kHz,字长为16 bit.本 。 ・×l 0. ▲L IIL.II【 . ▲ I.. .- 方案采用了三路语音作 ・0.05 『r l『1f。I r_ 叮。。r - .为源信号,每路语音取 32 000个样本点.混叠 矩阵设为 (a) (b) 图3 两路混叠语音及其频谱图 A. —厂1 Lt.an30。 。。 tan60。。 tan45。。-J ’ 1 1 ] 混叠后得到两路混叠信号,并对其进行sTFT变换,本实验采用 hamming窗.如图3所示.混叠信号的时频比率为 d( , )=II全 ( , )/ 。( , )l l则可得到具有相同a(rj, )的点的个数C( )的直方图,如图4所示. 我们通过求C( )的极值就得到了 的绝对值的估计 I 。I一0.577,I l一1.732,l 。I一0.988, 则二进制掩码设为 (r,, ):l, 其他, 其中,s为很小的常数,可以灵活设置. 』【o,I I一£<n(ri ̄/-I-k)<I I+£, 图4直方图 3.1估计源信号; ,;。 利用掩码M-(rj, )对混叠信号进行消除处理,得到消除后的混叠信号. ( , )一M。( , )垒。(ri, ), 。 ( , )一M。( , )垒 (rj, ). 经过反变换后的时域信号 (f), (f)如图5所示. 最后对 (f), (f),进行 FastICA,得到两个源信 号 ,;。,的估计,如图6所 示: 3.2估计源信号: ,: 图5经掩码消除后的混叠信号 图6两个源信号sA。, 。,,的估讣 维普资讯 http://www.cqvip.com 第4期 杜 军:基于二进制时频掩码和ICA的欠定语音盲分离 91 所用二进制掩码为M。( ,∞ ),估计过程和3.1相同.最后 0 1 得到源信号,;。, ,的估计,如图7所示. 0 O5 0 ▲.- … .‘1 k 一一.. 柚 —0 O5 r一_ 一’ 一 一 一一 3.3重构信噪比 —0.1 通过以上实验,我们已经得到了三个源信号的估计,我们使 用重构信噪比(16)来评价分离性能,如表1所示. 0 l 0.05 0 I. 1 ..』.._1 LL .山 ~ A —0 05 SIR一10log l ly ll。/l ly—y l l, —0 I ’Tfr I, r7-一w r 一 A y为重构信号,y为原始信号. 图7两个源信号:,,sA。,的估计 由表可见,本文方法对于实现时频域语音信号欠定盲 表1重构信噪比表 分离具有很高的分离成功率,提出的二进制时频掩码与 ICA相结合的信号盲分离方案取得了令人满意的分离效 果.但由于二进制时频掩码技术对信号稀疏性要求很高,所 以源信号的个数越多,本方案的分离也越困难. 5 结论 时频技术正被越来越广泛地应用于信号处理中.近年来,时频变换域盲源分离的研究也越来越多,利 用时频分析技术对混叠信号的时频分布进行分析,从中分离出源信号的时频信息,从而达到盲源分离的目 的.利用本方案进行欠定语音分离,可以消除因二进制时频掩码带来的音乐噪声,能够达到很好的分离. 参 考 文 献 E13 JOUUJINE A,RICKARD S,YILMAz O.Blind Separation of disjoint orthogonal signals:Demixing N sources from 2 mixtures EA3.in Proc.IEEE ICASSPEC].1stanbul,Turkey,2000. [2] BOFILL P,zIBuLEVsKY M.Blind separation of more sources than mixtures using sparsity of their short—time Fourier transform [A].in Proc.IWlCAEC3.Helsinki,Finland,2000. [33 ABRARD F,DEVILLE Y,wHITE P R.A new source separation approach for instantaneous mixtures based on time—frequency analysis[A].in Proceedings of the 5th International Worshop on Electronics,Control,Modelling,Measurement and Signals (ECM2S’2001).Toulouse,France,2001. [4]YLIMAz 0,RICKARD S.Blind separation of speech mixtures via time--frequency masking[J].IEEE Trans.Signal Processing,2004, 52(7):1 83O~1 847. [5]ARAKI s,MAKINO S,BLIN A,eta1.Underdetermined blind separation for speech in real environments with sparseness and ICAEA]. in Proc.IEEE ICASSPEC],2004. [6] ARAKI s,MAKINO S,SAWADA H.Underdetermined blind separation of convolutive mixtures of speech with directivity pattern based mask and icarA],in Proc.ICA2004[C],2004. [73 HVVARINEN A。OJA E.A fast fixed—point algorithm for independent component analysis ̄J3.Neural Computation,1997,9(7):1 483 ● ●~1 492. [83 HVVARINEN A.Fast and robust fixed—point algorithms for independent component analysis[J].IEEE Trans.on Neural Networks, 1999,10(3):626~634. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- obuygou.com 版权所有 赣ICP备2024042798号-5

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务