基于DSP实现的数字语音信号处理技术研究

基于DSP实现的数字语音信号处理技术研究

曹洁[1]2011年在《基于DSP的语音信号滤波技术研究》文中进行了进一步梳理语音滤波技术是语音信号处理的一个重要研究领域,随着数字信号处理技术的高速发展,DSP芯片已经成为语音信号处理的主要工具,在单片DSP芯片上实时实现较复杂的语音编解码算法成为可能,同时可方便地实现算法更新,从而能够在不更换硬件的情况下实现功能的升级。语音信号滤波又是语音处理系统研究中的一个关键问题,滤波的效果会直接影响语音信号的质量,而DSP技术的不断提高,保证了滤波效果的实时性和准确性,如何将语音信号滤波技术移植到DSP上也就成为一个重要的问题。恰当的建立模型、合理地确定算法、选定参数、设计可行的系统都是本课题研究的主要内容。本文针对语音信号的特点,首先对传统的语音处理的方法进行了分析推导,以CCS软件为基础,用DSP特有的混合编程的方式实现了经典的FIR滤波器与IIR滤波器,然后用TI公司5000系列DSP-TMS320VC5509作为核心芯片,设计了一个语音采集及滤波系统,通过CCS平台和DSP编程,对基于汉明窗的滤波算法进行实验,在选取不同输入信号的情况下,对滤波效果进行比较,验证了本文研究方法的可行性。结果表明:利用本文所用的语音信号处理的算法,采集各种环境下不同的语音输入信号,取得了较好的降噪效果。

杨东[2]2007年在《基于DSP的语音控制系统研究与设计》文中研究说明目前的人机交流主要是手动操作方式实现人机对话,限制了人与计算机系统和机电系统交流的灵活性。为了提高数字化家电系统人机对话灵活性,方便老人、残疾人等特殊人群需要,在人机对话方面需要寻求更好的信息交换手段。因为语言是人类最主要和最基本的交流方式,而且随着数字信号处理软件和硬件的发展,到目前为止语音处理技术日趋成熟,已接近实用化阶段。因此本文根据实际需要提出了一种采用语音作为智能数字化系统的人机交互方式,并设计了一套智能家电的语音控制系统。(1)经过对语音信号的研究,依据对不同信号处理目的和要求,分析并提出语音信息处理的各种方法,实现对语音信号的数字化、前段处理和混合信号盲源分离等处理,并且就各种处理算法进行了仿真实验。(2)重点阐述了系统的硬件构成、技术指标和功能要求,给出了系统的总体结构,研究设计了基于DSP的硬件系统,给出整个系统的硬件电路图,详细说明了系统中MCU模块、数据采集模块、电源管理模块和系统硬件复位模块的组成原理和设计方法。(3)设计开发了系统软件,给出了系统软件总体设计思想,详细说明了语音信号数字化、端点检测和盲分离的软件设计和实现方法。(4)在语音信号处理的基础上设计了语音控制的实现部分,给出了控制操作实现的详细硬件设计和软件设计方法,并解决了控制部分和信号处理部分的接口电路和通信方法。为了验证整体语音控制系统设计中信号处理算法实现的准确性和有效性,最后在CCS软件环境下还就文中软件实现部分,完成了基于仿真器和仿真板的测试。本文提出的语音控制系统的软硬件设计具有通用性,可灵活应用于智能家电之中。

牛景涛[3]2003年在《基于DSP实现的数字语音信号处理技术研究》文中进行了进一步梳理数字信号处理(Digital Signal Processing)技术,从20世纪60年代以来,随着计算机科学和信息科学、集成芯片制造工艺的飞速发展,数字处理技术应运而生并得以快速发展。 语言是人们进行信息沟通的主要方式之一,它具有直接、自然、方便等优点。语音则是语言的物理层表达方式。语音处理主要是对语音进行机器处理,以达到传输、自动识别、机器理解等目的。论文中首先对语音信号的基本处理问题进行了分析和对比,然后在自己设计的基于TMS320VC5402的DSP实际系统上,进行了语音处理过程的滤波、采样、傅立叶变换和谱包络提取的算法实现研究,讨论了在算法的DSP实现方法,分析了运行实验结果。在此基础上,对GSM系统中的编码、回声抵消、说话人识别和交通车辆内部的噪声抵消应用进行了研究。最后对DSP实现语音信号处理的存在的问题和发展前景进行了展望。

应俊[4]2006年在《基于DSP数字助听器关键技术的研究》文中研究说明本文在学习国外当前先进技术的基础上,对数字助听器的软硬件开发进行了深入的探索,并结合听觉生理学和语音信号处理技术,讨论一种基于TI公司DSP TMS320VC5416数字助听器关键技术的设计思路和实现方法。 本文介绍的数字助听器系统之设计包括硬件电路和算法研究,硬件上主要由核心处理芯片TMS320VC5416和模拟接口芯片TLV320AIC23B两部分构成,系统的主要功能均在DSP中完成,硬件电路设计相对比较简单。本文重点在于助听器语音信号处理算法的研究,系统能够实现依频域宽动态压缩,移频压缩和自适应噪声消除等功能。首先分析目前数字助听器应用的数字信号处理算法,针对传统多频段压缩放大方法存在的不足,提出依频域的宽动态压缩算法。该算法灵活的实现患者在不同频段需要不同增益补偿的功能,在对不同频率成分进行非线性压缩放大的同时,尽可能保留较多的基本频谱特征信息。同时本文还专门针对重度听力障碍患者听力学特征所提出移频压缩方案,将语音频谱从高频部分按比例搬移到低频,保证语音频谱适应患者残留的动态范围而保持频谱的相对特征不变。此外本文还设计一种语音信号自适应噪声消除算法,利用LMS自适应算法的特点抑制语音信号中的宽带噪声信号,提高信噪比。系统所有的算法的目的都是避免语音失真,提高舒适感。而后本文还利用MATLAB软件仿真实现所有算法,对比实验结果,进一步确认算法的可行性。 最终,算法的设计方案被移植到DSP语音实验平台上,在CCS强大的编译环境中,采用C和汇编语言联合编译的方式实现所有的算法,并调试成功,通过对比实验结果,取得符合理论推算的结果,从而验证了系统的可操作性。本系统可根据患者的听力测试结果任意调节频响参数,满足临床听障患者对听力进行补偿的要求,也为进一步研究助听器高级算法搭建了较好的实验平台。

杨小玲[5]2006年在《基于DSP的实时语音检测系统的研究》文中研究说明语音检测是语音信号处理的前端处理,其准确性在很大程度上影响了后续语音处理的效果,如语音分析、语音编码、语音识别和语音合成等。有效的语音检测不仅能很大程度地减少语音信号的处理时间,而且能祛除无声段的噪声干扰,是数字语音处理中的重要组成部分。在众多语音信号处理应用领域,语音检测技术有非常重要的意义。本文采用TMS320VC5416设计了一套基于DSP的实时语音信号检测系统,并利用Matlab对目前常用的几种语音检测算法进行了详细的分析比较和算法仿真,如:时域内的短时能量,短时平均幅度,短时过零率,短时自相关,短时平均幅度差和频域的傅立叶分析法等。在此基础上,提出了一种简单实用的语音信号检测方案,该检测方案利用语音信号的短时平均幅度(AM)和短时平均幅度差(AMDF)两种特征算法来实现准确的语音信号检测。本文所设计的实时语音信号检测系统在硬件设计上,选用TI公司的TMS320C5416 DSP处理器和TLV320AIC23B音频芯片作为系统核心芯片,实现语音信号检测系统的实时检测。在软件设计上,采用DSP汇编语言和C语言混合编程技术,编写了相应软件,实现了上述语音信号检测方案,进一步在CCS与Matlab的共同仿真中,对单频信号、语音、噪声以及加噪语音信号的平均幅度差进行了分析,确定了语音信号的平均幅度差的门限值。同时,在DSP硬件环境的支持下,确定了平均幅度的门限值和前后向保护模块的保护帧数值,进一步提高了算法的性能,并完善了系统功能。实验结果分析表明,该系统能在较低的信噪比情况下实时准确地检测出语音信号,而且计算方法简单,软件设计模块化,易于进行二次开发,满足实时应用系统的要求。

王瑜琳[6]2013年在《强噪声环境下的语音增强算法研究及其DSP实现》文中认为复杂环境中噪声干扰严重影响语音通信的质量,无法正确传达语义,因此语音增强处理十分必要,已成为国内外语音信号处理的一个研究热点。目前,针对语音增强技术的算法种类多种多样,而以自适应滤波技术为基础的噪声对消技术凭借其较强的自我学习及其优良的跟踪性能成为一种被广泛应用的语音增强方法。但是传统自适应滤波算法本身存在适应性差、输入信号高度相关时收敛速度慢等问题,使得其发展受到了一定的限制。为了解决这一问题,本文从自适应滤波理论出发,在分析标准最小均方误差算法(least mean square, LMS)原理以及性能的基础上,综合变步长LMS算法与解相关原理的优点,提出了一种改进的语音增强算法。该算法在利用箕舌线函数来更新自适应滤波步长因子的同时引入解相关原理来进行语音降噪处理。并且文章从算法的跟踪能力、计算复杂度以及语音的增强效果等方面分析、对比了本文提出的算法与其他几种LMS算法,证明了本文提出的算法能有效改善传统算法适应性差、收敛速度慢、稳态误差大等问题。在硬件实现上,文章选用具有高速帧处理能力的DSP芯片作为系统的主控核心,同时利用其多通道缓冲串口(McBSP)与扩展音频接口芯片TLV320AIC23实现无缝连接。在简化系统设计复杂性的同时,使系统集语音信号的高速采集、降噪处理以及输出于一体。同时文章基于该DSP系统对不同类型的含噪语音进行降噪效果测试。相关实验结果显示,含噪语音经该算法处理后,信噪比得到了显着的提高。此外对增强后语音的试听测试也表明,经本系统处理后的语音明显变得比较清晰,可懂度也得到了较大的提高,达到了增强有用语音的目的。

罗雪松[7]2008年在《数字对讲机语音处理方案的研究及DSP实现》文中指出在数字集群系统的话音业务中,要求话音能够有比较好的质量,编解码的复杂度适中,对于外部干扰和背景噪声的抗干扰能力强,编解码的芯片尽可能地具备高性价比,并且功耗低。连续可变斜率增量调制(Continuously Variable Slope Delta Modulation,CVSD)是一种在卫星通信、移动通信、军事通信等信道噪声比较大的专用网中应用非常广泛的语音信号的波形编码方式。国际电信联盟ITU制定了16kbps和32kbps两种速率的CVSD统一标准。本文对现有的数字对讲机上语音专用处理芯片采用的CVSD语音编码算法进行了研究和论证,通过计算机的仿真,证实CVSD编码能很好地还原语音信号。此外,还针对CVSD编码的特点,通过软件编写滤波器,对CVSD编解码数据进行滤波和去噪,使得语音信号更平滑,提高了话音的质量。同时考虑到语音专用处理芯片在算法改动以及价格等方面的局限性,将CVSD算法从专用芯片中移植出来,在DSP平台上实现。通过人耳的主观判断,证实在数字信号处理器(Digital Signal Processing,DSP)平台上经过CVSD算法处理之后的语音信号同样能保持良好的质量和效果,符合实际的通话需求。以上工作为数字对讲机的语音处理提供了扩展的可能。论文最后基于CVSD算法和DSP提出了改进之后的数字对讲机的系统结构方案,并讨论了该系统可使用的语音传输协议的方案。

王玥[8]2006年在《基于DSP的嵌入式语音门锁的设计与实现》文中提出作为生物识别技术的一个重要分支,说话人识别技术的研究始于六十年代,随着计算机技术与信息化社会的发展,说话人识别技术作为具有语音识别与理解功能的智能人机接口,其应用领域正在不断扩大。在金融安全、数据加密、电子商务等各个领域都有很广的应用潜力,并将在我们的生产和生活中发挥日益重要的作用。说话人识别技术越来越受到学术界的关注,目前已经有许多成熟度较高的说话人识别模型,本文的内容正是关于说话人识别应用系统的研究,主要完成了基于DSP的嵌入式语音门锁的硬件设计与实现。按照设计方案,整个嵌入式门锁硬件主要包括以下单元:语音信号采集单元、语音信号处理和存储单元、人机接口单元。整个设计中遵循低功耗设计规范,综合考虑成本与性能因素,确定以TI公司的数字信号处理器TMS320VC5416、SST公司的39VF400A FLASH存储芯片、LATTICE公司的复杂可编程逻辑器件ISP2032VE和TI的模数转换芯片TLV320AIC23B为核心的系统组成。在此基础上所作的工作有:(1)使用TI公司的TLV320AIC23B芯片完成语音信号的采集、预处理、通过DMA送给核心运算器件DSP。(2)由DSP提取话人特征,构建数学模型进行精确匹配,完成识别。(3)解决了系统掉电后信息丢失问题,使用外扩FLASH存储用户信息。(4)完成了门锁软件的总体设计。使用SST公司的FLASH存放DSP的程序代码,运用TMS320VC5416的Bootloader功能实现了门锁的上电自启动。(5)实现了低功耗的门锁设计方案,使门锁更换一次电池可使用100天以上。实验证明本门锁设计合理,方案可行,有广阔的市场应用前景。

李生笔[9]2008年在《基于OMAP5912平台的人机语音交互系统》文中进行了进一步梳理现代移动通信终端发展的一个基本趋势就是:体积越来越小,功能越来越多。这样的情况下,无论是使用键盘还是触摸屏,都难以提供足够良好的人机交互,尤其老年人、视力有障碍者对这些设备的操作难度更大。此外,工业控制、军事、医疗等多个领域也都存在人机交互难度大的问题。而语音是人类最便捷、最自然的信息交换方式,如果可以在这些设备中嵌入一个有效的人机语音交互系统,就能很好地解决此类问题。因此嵌入式语音识别系统作为嵌入式人机语音交互系统的核心,有非常广阔的应用领域。然而由于嵌入式设备本身资源和使用环境的限制,该领域一直是国内外语音识别技术研究的难点。本课题正是对基于嵌入式设备的人机语音交互这一领域进行探索和研究,取得了一定的经验和成果。在硬件部分,考虑到嵌入式设备除了需要支持运算量非常大的语音识别引擎以外,还需要运行图形用户界面或其它应用程序,且设备的功耗不能太大,普通的单核处理器很难同时满足这些要求。因此本课题使用TI公司的非对称双核OMAP5912处理器作为嵌入式语音识别系统的CPU,利用TMS320C55x DSP处理器强大的数字信号处理能力且极低功耗的特性,分担GPP端的一部分数字信号处理任务,提高系统的运行效率。在软件部分,开源软件运动已经发展20多年了,在科技界开源思想早已深入人心,利用现有的开源软件可以极大地缩短软件的开发周期,同时降低开发成本。我们主要依靠开源社区的软件工具,建立了OMAP5912软件开发平台,将Bootloader、Linux内核和DSP Gateway等工具软件移植到了OMAP5912处理器,证明DSP运行正常,并且GPP能够通过DSPGateway对DSP进行控制,使其在语音识别过程中分担一部分数字信号处理任务。在人机语音交互系统的构建过程中,我们以开源社区的PocketSphinx语音识别引擎为基础,对其中过于复杂的代码进行了删减,同时对部分程序的功能进行了合并、修改或增强,使程序的编译、运行和维护更为容易。论文最终完成了开源社区的PocketSphinx语音识别引擎向OMAP5912处理器平台的移植,并以此为基础实现了基于OMAP5912嵌入式处理器的人机语音交互系统,达到了课题预定目标。

郝软层[10]2006年在《基于DSP的低码率语音实时保密通信系统的设计与实现》文中研究指明语音保密通信是防止语音内容被窃听的通信方式,在军事和商业上具有极大的实用价值。采用数据加密技术是语音保密通信的重要手段。信道带宽是非常有限和宝贵的资源,而低码率语音编码技术是节省带宽的重要方法之一。DSP(数字信号处理器)是适用于数字信号处理的专用微处理器,能够快速、有效地实现语音压缩编码和语音数据加密。 本系统就是以低码率语音编码技术和数据加密技术为背景,以数字信号处理技术为实现手段,以DSP为处理器,就如何在节省信道带宽占用的同时又能保证语音信息的安全性,提出了基于TMS320VC5509ADSP的低码率语音保密通信系统方案。为了在节省带宽资源的同时保证良好的话音质量,系统采用2.4kbps的MELP低码率语音编码算法,并针对TMS320VC5509A的硬件特性对MELP算法的实现进行汇编优化。为了保证语音通信的安全,系统采用实现速度快安全性高的AES算法来加密压缩后的语音信号。密钥协商采用的是Differ-Hellman协议。由于采用DSP实现和软件模块化设计,系统具有良好的扩展性,能够更换语音压缩编码算法和加密算法,所以本系统又可以作为低速率语音实时保密通信的实验平台。 最后系统进行了测试,效果满意,基本达到了设计要求。

参考文献:

[1]. 基于DSP的语音信号滤波技术研究[D]. 曹洁. 兰州理工大学. 2011

[2]. 基于DSP的语音控制系统研究与设计[D]. 杨东. 湖南大学. 2007

[3]. 基于DSP实现的数字语音信号处理技术研究[D]. 牛景涛. 西北工业大学. 2003

[4]. 基于DSP数字助听器关键技术的研究[D]. 应俊. 中国人民解放军军医进修学院. 2006

[5]. 基于DSP的实时语音检测系统的研究[D]. 杨小玲. 华中师范大学. 2006

[6]. 强噪声环境下的语音增强算法研究及其DSP实现[D]. 王瑜琳. 重庆大学. 2013

[7]. 数字对讲机语音处理方案的研究及DSP实现[D]. 罗雪松. 西南交通大学. 2008

[8]. 基于DSP的嵌入式语音门锁的设计与实现[D]. 王玥. 吉林大学. 2006

[9]. 基于OMAP5912平台的人机语音交互系统[D]. 李生笔. 太原理工大学. 2008

[10]. 基于DSP的低码率语音实时保密通信系统的设计与实现[D]. 郝软层. 解放军信息工程大学. 2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于DSP实现的数字语音信号处理技术研究
下载Doc文档

猜你喜欢