您好,欢迎来到安徽省安全技术防范行业协会!
0551- 62818875 64280445
- 行业动态
-
行业资讯
自动识别判断说话人特征的声纹鉴定新技术
来源:互联网 发布时间:2010/11/24
说话人识别的研究始于20世纪30年代。随着研究手段和工具的不断改进,说话人识别的研究逐渐摆脱了早期单纯的人耳听辨模式。Bell实验室的L?G?Kesta用目视观察语谱图的方法进行识别,并提出了“声纹”的概念。我国的声纹鉴定技术起步较晚,上世纪80年代末,公安部二所(现为公安部物证鉴定中心)引进了美国的DSP5500声谱仪,开展声纹鉴定的科研和检案实践。1992年公安部物证鉴定中心完成了部级重点课题《5500语图仪在声纹鉴定中应用的研究》,2001年,该中心承担的国家九五科技攻关项目《声纹鉴定关键技术及话者识别系统研究》通过验收,研制出具有自主知识产权的VS99语音工作站,标志着我国声纹鉴定技术日趋成熟。
“声纹鉴定与自动识别技术研究”项目由公安部物证鉴定中心等单位完成,其主要研究成果是将声纹自动识别功能植入VS99语音工作站,该系统能对说话人特征进行自动分析、判断和语图显示及测量,并可结合专家鉴定以确定说话人身份,适合于法庭科学实际应用。本项目研制出当前声纹鉴定工作中非常实用的集声谱仪和说话人自动识别系统为一体的语音工作站,大大提高了结论的准确率,为声纹鉴定提供了一个实用系统。
创新技术:
1.抗噪声处理
噪声对检验结果的影响是一个不可忽视的问题。在本系统中对于非平稳噪声,研究人员提出了利用偶数帧段主分量特征输入隐马尔可夫模型(HMM)结合时间方向平滑处理的SS方法来提高噪声环境下汉语连续语音识别系统鲁棒性的方法,取得较好的识别结果。
2.语音端点检测
端点检测可以避免由噪音引起的误动作以及由噪音引起的误识别,对于准确检测语音信号的起始、提高识别系统精度等有重要意义。采用传统的语音端点检测器SAD很容易造成语音激活的漏检。另外,较大的干扰信号,又有可能被当成是语音的激活,造成语音激活的虚检。为克服这一缺点,研究人员采用一种基于相关性的语音激活检测器,定义了一种有效的相关函数,找到了判别门限设定方法以及防止漏检和虚检的方法。
3.识别算法
本系统采用的是基于GMM模型的优化算法。
(1)改进的GMM的模型训练方法
实验中发现EM算法存在出现奇异阵的重大缺陷,而最大似然估计(ML),虽然识别率比较低,但不会出现奇异阵。因此研究人员采用最大似然估计(ML)所得模型为初始模型,然后用EM算法中的每步的模型通过α值控制修正比例对其进行修正,称为改进EM算法。
(2)基于遗传算法的GMM的模型优化算法
研究人员对传统的遗传算法进行了改进,用于GMM的参数优化中,大大提高了模型的优化程度。
(3)GMM的说话人识别方法的优化
研究人员提出了一种新的优化的基于GMM的说话人识别方案,该方案通过先对一次发音对应一个模型的各帧似然度做一种特定变化然后再计算该音节总的似然度,也就是该音节对应该模型的总的评分,记作Sc,与最大Sc所属模型相对应的说话人即为目标说话人。
社会效益:
目前,公安部物证鉴定中心完成的国家“九五”攻关成果VS99语音工作站已经在国内普及,在实际办案中发挥了重要作用。该项目是在VS99的基础上增加自动判别功能,从而进一步提高办案效率和鉴定的准确率。
该项目研制的声纹鉴定自动识别系统具有完全自主知识产权,实用性强,非常适合公安工作的实际需要,可在侦查中对大量嫌疑人进行排查,可以有效地提供侦查方向,缩小侦查范围,提高工作效率。同时该系统具有语图实时显示功能,适用于行动技术中语音信号的采集。自2002年以来,实际检验鉴定案件200起,案件类型包括刑事、经济、民事、治安案件。从结案反馈及法庭审判结果看,正判率为100%。