基于DSP的实时语音处理系统的设计.doc
《基于DSP的实时语音处理系统的设计.doc》由会员分享,可在线阅读,更多相关《基于DSP的实时语音处理系统的设计.doc(43页珍藏版)》请在咨信网上搜索。
山东建筑大学毕业论文 目 录 摘 要·································································Ⅲ ABSTRACT·····························································Ⅳ 1绪 论 1.1 语音处理研究状况······················································1 1.2 语音处理的硬件基础和应用··············································4 2系统硬件部分概述 2.1 DSP系统设计概述······················································6 2.2 系统的总体构成·······················································7 2.3 硬件系统核心芯片的选择···············································8 2.4 实时语音处理的基本要求···············································9 3设计部分 3.1 设计目的和要求·······················································10 3.2 设计原理·····························································10 3.3 设计内容·····························································11 3.3.1 理论依据··························································11 3.3.2 信号特征分析······················································11 3.3.3 方案设计··························································11 3.3.4 方案论证··························································12 3.3.5 器件选型(硬件电路的设计)·········································13 4 软件设计 4.1 DSP软件开发工具和编程特点··········································25 4.2 软件设计··························································· 26 4.3 DSP初始化··························································27 4.4 音频采集程序······················································· 30 4.5 TMS320VC5402的并行引导装载分析和设计·······························32 总结与致谢·····························································34 参考文献·······························································35 附 录·································································· 36 摘 要 提出一个基于TMS320VC5402的音频信号采集与处理系统。介绍了该系统的总体方案和硬软件设计。讨论了模/数(A/D)和数/模(D/A)转换电路的设计方法以及如何利用TMS320VC5402的多通道缓冲同步串口(McBSP)和PCM1800及PCM1744芯片接口来实现音频信号的采集和输出。实验证明:所设计的基于DSP的硬件和软件系统是一个很好的音频信号采集与处理系统。 关键词:多通道缓冲同步串口;音频信号;TMS320VC5402;采集与处理 DSP-based real-time voice processing system Abstract Abstract: A TMS320VC5402-based audio signal acquisition and processing system. Describes the general scheme of the system and the hardware and software design. Discussed the analog / digital (A / D) and digital / analog (D / A) converter circuit design and how to use TMS320VC5402 multi-channel synchronous serial port buffer (McBSP) and the PCM1800 and PCM1744 chip interface for audio signal acquisition and Output. Experimental results show: the designed DSP-based hardware and software system is a good audio signal acquisition and processing system. Keywords: Simultaneous multi-channel buffered serial port;audio signal;TMS320VC5402;acquisition and processing - 37 - 1 绪 论 1.1 语音处理的研究状况 语音是人类进行信息交流最直接、最方便、最有效的工具,语音信号是携带语音信息的语音声波。在信息化时代,人们也期望用这种最便捷的信息交流工具和各种信息存储、处理的设备和终端进行信息交互。语音信号处理研究如何能更加有效地产生、传输和获取语音信息的一门学科。它涉及数字信号处理、语言学、语音学,生理学、心理学、模式识别以及人工智能等多个学科的知识,是信息技术学科中发展最为迅速的一个领域。语音信号处理内容非常广泛,它包含语音识别语音合成,此外还有语音压缩编码、语音理解、说话人识别、语音增强等各个分支,总的来说语音信号处理包含了语音信号的数字表示方法,语音信号处理的各种方法和技术以及语音处理理论和技术在各个领域中的实际应用。 语音信号的处理最早可以追溯到1874年电话的发明,电话的理论基础是尽可能不失真地传送语音波形。直到1939年Dudley发明声码器,通道声码器技术取代了“波形原则”的处理方法,它的理论基础认为语音是由人的声带振动产生的声源(载波)受到不断变化的声道的控制(调制)而产生的,这一概念就是以后迅速发展起来,并广泛应用到各种理论研究和应用实际过程中的语音参数模型的雏形,由此人们开始了语音合成和语音压缩编码的研究。上个世纪60年代中期数字信号处理的方法和技术取得突破性进展,主要是快速傅立叶变换算法的成功应用。出现了第一台以数字计算机为基础的孤立词语音识别器,随后又成功研制出第一台有限连续语音识别器。70年代初,Flanagan出版的重要著作《语音分析合成和感知》,奠定了数字语音处理的系统理论基础。与此同时,倒谱分析技术和线性预测技术在语音处理中得到成功应用,微电子和集成电路技术取得新的进展,高性价比的微处理器芯片和性能优异的专用信号处理芯片不断问世,再次推动了 语音信号处理技术的发展和应用。 语音识别ASR以语音为研究对象,它是语音信号处理的一个重要研究领域, 是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终日标是实现人与机器进行自然语言通信,让人机交互界面更加自然和容易使用。语音识别是语音处理中的难点,对它的研究开始的比较晚,但它的一些研究方法和结果可以运用到另外的研究分支中去,因此也是语音处理研究中的重点。1952年贝尔实验室的Davis等人首次研制成功能识别十个英语数字的特定人孤立数字识别系统,该系统的成功研制标志着人们开始语音识别的研究工作。此后很长的时间里,语音识别的研究方法主要是用特殊的硬件获取语音信号的特征参数,再在计算机上进行模板匹配和判决,由于受当时计算机技术和信息处理理论的限制,语音识别一直未取得突破性进展。直到上个世纪70年代,动态时间归正技术(DTW)算法、线性预测分析技术(LPC)理论、LPC频谱分析、隐马尔可夫模型(HMM)、人工神经元网络(ANN)、矢量量化(V-Q)等理论,并在语音识别中成功运用,开创了语音识别研究的新局面,语音识别系统的识别率得到了显著的提高。此后语音识别系统由原来的特定人小词汇量孤立词的系统发展到能进行非特定人、大词汇量、连续语音识别。1988年美国卡内基-梅隆大学运用VQ和HMM技术研制出了非特定人、大词汇量、连续语音识别系统.SPHINX系统,它可以理解由1000个单词构成的4200个句子,是语音识别历史的一个里程碑。 我国语音识别理论研究和应用起步较晚,但由于汉语具有音节种类较少的特点,汉语是单音节语言,汉语中音节数只有400个,加上音调才1200个,词是由音节组合成, 便予以音节识别为基础实现大词汇的语音识别,因此,进展较快。清华大学、中国科学院声学所和西安电子科技大学相继成功研制出无限词汇的汉语听写机。四达公司在90年代初推出首批汉语听写机之后,与哈尔滨工业大学合作研制出具有自然理解能力的新产品。模识科技公司PattekASR中文语音识别产品,它面向不同计算平台和应用,具有国际先进水准,是我国第一个拥有完全自主知识产权的语音识别技术产品。模识科技公司此次推出的产品具有识别率高、对环境噪声和不同口音适应能力强、系统占用资源少等特点,PattekASR 对方言的识别率在95%以上。只要对现有的手机、家电、电话总机稍作改装,就可以用语音命令上网查阅资料、控制电视、接通电话分机,国外一些著名的大公司纷纷加大对汉语语音识别研究的投入。 进入上个世纪90年代,随着多媒体时代的来临,语音识别系统由实验室走向实用。许多发达国家和一些公司如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资,其中语音识别软件的发展最为迅速。语音识别软件是语音识别理论和计算机技术相结合的产物。IBM公司于1997年开发汉语Via Voice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统Via Voice‘98,平均识别率可达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。IBM宣布,为增强网络浏览和语音电子邮件的功能,将推出其新一代语音识别软件。可使用户通过语音,而不是使用键盘来浏览网络、切换应用程序、执行命令、口授邮件和文本文件等操作。Microsoft也在语音识别研究领域进行了投资,其开发的windows xp语音识别技术,可以在包括word在内的所有应用程序的文本信息的区域——记事本、Internet Explorer地址栏和Outlook Express ——内使用口述输入方式,来替代传统的键盘、鼠标按钮输入方式。Speech Work公司的代表产品SpeechWork6,利用该产品,用户可以在没服务人员介入的情况下, 用自然语言同系统进行信息交互.完成诸如旅游预约、股票交易、银行服务、订票服务等。市场上还出现了语音识别电话、语音识别记事本等产品,如美国VPTC 公司的Voice Organizer和法国的Parrot等。 语音合成是最早被研究的语音处理分支,它研究的主要内容是让人们通过听觉来获取以其他形式表示的信息。最早的语音合成是用机械的方式模拟人的发声过程而产生声音。1939年Dudley发明的声码器,用电子线路产生语音的声源,并构成滤波器模拟声道的滤波作用。现代的语音合成都是基于计算机技术的语音处理过程。由D.Klatt设计的串、并联混合,是语音合成研究中最具代表性的工作。20世纪90年代末,日本的一些研究学者提出一种少样本、不等长语音拼接合成技术—PS0LA,该方法来源于利用短时傅立叶变换重构信号的叠接相加法。当前汉语语音合成系统中,合成效果较好的都是采用波形拼接的合成技术,文本--语音转换系统(TTS)是语音合成的一个重要应用形式。语音合成的应用领域十分广泛,如:自动报警、报时、车站机场广播、电话查询业务以及各种电子出版物的语音朗读等。 语音压缩编码是伴随语音的数字化而产生的,它的研究和语音合成一样起源于1939年Dudley发明的声码器,若简单地由连续语音信号抽样量化得到的数字语音信号传输和存储,就会占用太多的信道资源和存储空间。研究表明语音信号中含有大量的冗余信息,如何采用各种编码技术,在保证尽量少的失真并具有一定的可懂度和自然度的情况下,减少语音信号的冗余度,成为语音压缩编码的主要内容。最早研究和使用的编码方法是不依赖语音产生模型假定,以PCM和ADPCM为代表的波形编码技术,它的编码数率较高,一般在16kb/s~64kb/s,具有语音音质高、抗躁能力强的特点。1974年,LPC编码首次用于分组语音通信,传输数率达到3.5kb/s,实现了低速的编码。一些以LPC以及由其改进和演变的混合编码为代表的基于模型假定的编码方法,可以更大程度上减少语音信号的冗余度, 使低速率传输、存储语音信息成为可能。美国在1980年公布了一种2.4kb/s的线性预测编码技术后,于1988年又公布一个4.8kb/s的码激励线性预测编码(CELP)语音编码算法,随后欧洲也推出了16kb/s的规则脉冲激励(RELP)线性预测编码算法。这些语音编码算法具有较好的可懂度和自然度。随着对低速率语音编码算法研究的深入和计算机网络技术的迅速发展,语音信号经过压缩后在互联网上以数据包的形式传输,就形成了IP电话,它用VOIP技术实现的通过TCP/IP网络以不同于传统的电话网来传输语音信号。由此衍生出在网络环境下的语音识别和语音压缩编码,成为语音处理新的发展方向。20世纪90年代,针对不同的应用,国际电联和一些地区标准协会制定一系列语音压缩编码标准,如数码率为5.3-6.4kb/s的G.723.1,以及数码率为8kb/s的G.729.等,这些标准的制订保证了应用在通信网中的各种语音编码具有良好的兼容性。 语音处理的研究取得很大的成绩,一些应用也取得突破性的进展,有很多有关的研究成果已实现商品化生产并投放市场,取得较好的经济效益和社会效益。一些信息科学中的新出现的理论和处理方法引入语音处理的研究中,如小波分析、分形理论以及语音信号的非线性处理方法。由于语音本身和应用环境的复杂多变,语音处理系统的性能还是有很多不尽人意的地方,用它来解决实际问题还是有很多困难,如无限词汇汉语合成中连续语流中各基音轮廓的平滑过渡问题,语音识别系统的适应性差,主要体现在对环境依赖性强,高噪声环境下语音处理的进展缓慢。 1.2 语音处理的硬件基础和应用 绝大多数语音信号数字处理系统有很高的实时性要求,要对输入的语音信号做出快速的反应,因此系统工作在实时方式(在线方式)下,就对系统所采用硬件的性能要求很高,包括处理速度和存储容量等。语音处理所要完成的任务越来越复杂,处理效果的要求不断提高,语音处理算法也随之日益复杂,它会要求语音处理器件以及其辅助器件在几十个毫秒或更短的时间内处理、存储大量的语音数据。需要语音处理器的运算速度达到10—20MIPS,在应用中会根据任务的要求不同处理速度甚至要达到50MIPS。语音识别与合成等领域对处理系统的内存容量往往要求达到若干MB。实时语音信号数字处理系统通常以两种方式实现:第一种是用一台计算机作为主机,插上一块或若干块数字信号处理板来构成,后者由通用或专用的数字信号处理器芯片(DSP芯片)及相应的存储芯片、接口芯片和语音信号的转换芯片组成。第二种则由专用或通用的DSP芯片及其它辅助芯片构成一个独立工作的系统。前者通常称为非脱机工作系统,用于语音识别、合成、增强或模拟实验中。后者称为脱机工作系统,用于编码、小词汇表识别与合成等场合。通用DSP芯片的出现及其性能价格比的迅速提高为各种实用化语音信号处理系统的应用实现提供了硬件基础。自从1980年以来,DSP芯片得到了迅猛发展, 很多运算速度达到几MIPS。生产DSP芯片的公司有80多家,其中以美国的TI公司为代表,出产了一系列种类齐全可用于不同行业的DSP芯片,一些型号的芯片的运算速度和功能完全满足实时语音信号处理的要求,本文在硬件系统中采用TI公司的TMS320VC5402通用DSP处理芯片。 随着微电子集成技术的发展,很多公司相继研制出了专用的语音处理芯片。语音处理芯片外接一些控制器,构成一个语音处理系统就可完成特定的语音处理任务。如TI公司、Votrax公司、ISD公司等生产的语音存储与再生芯片,以ISD 公司的ISD系列芯片为代表。语音合成芯片有TI公司的TMS5220,语音识别芯片有东芝公司的T6658A,语音编码芯片有Digital Voice System.1nc推出的AMBE-1000以及美国国家半导体公司生产的CMX639。 2 系统硬件部分概述 本章首先对DSP系统进行介绍,围绕以TMS320C5402为核心,给出一个DSP系统硬件部分的设计方案,重点分析了系统各组成模块的功能,给出了具体实现方法。 2.1 DSP系统设计概述 一个数字信号处理系统是电子技术、信号处理技术与计算机技术相结合的产物。其设计通常分为两个方面的内容:信号处理部分和非信号处理部分。信号处理部分包括系统的输入和输出、数据的编排和处理、各种算法的实现、数据结果的显示和传输等;非信号处理部分包括电源、硬件结构、成本、体积、可靠性和可维护性等。一个应用系统的设计大致可分为7个部分: (1) 确定系统性能指标 (2) 信号分析 (3) 核心算法模拟与验证 (4) DSP芯片和系统外围器件的选型 (5) 硬件设计和调试 (6) 软件设计和调试 (7) 系统集成与测试 下面对每个部分的内容给予简要的说明: (1)确定系统性能指标:它主要根据用户对应用系统的要求,给出系统级的技术要求和相关说明。这些要求和说明包括处理的项目和方式、处理系统的所有性能指标(包含系统非信号处理的性能)以及系统的测试和验证方式等。 (2)信号分析: 这部分主要定义输入/输出信号的类型,即将分析的信号是随机或确定信号, 模拟信号或数字信号,是一维还是多维信号。分析信号的频率范围和系统的带宽, 估计信号的最大和最小电平,是否需要进行预处理。确定输出信号使用的方式、数据的吞吐率和对实时性的要求。信号分析的结果是进行信号处理算法设计的基础。 (3)核心算法模拟和验证: 在这部分依据第1部分提出的要求和第2部分对信号分析的结果,对不同类型的信号和要求的处理方式确定相应的算法。在编写信号处理算法时,首先可利用一些软件如MATLAB,对其进行仿真计算,保证算法的正确性,还要结合系统的硬件资源考虑这些算法程序的可行性,如系统的处理能力、存储容量、工作速度等。 (4)DSP芯片和系统外围器件的选型: 在选择系统所要用到的器件前,需要先分析系统数据吞吐率、存储容量以及输入/输出带宽,它们决定了系统使用的主控处理器和一些外围器件,如DSP芯片的处理速率、和外围器件进行数据交互的速率、存储器空间的大小,扩展存储器件的工作速度和容量等,根据分析的结果选择满足系统性能要求的DSP芯片、信号转换芯片、逻辑控制器件和接口以及外部扩展存储器芯片。 (5)硬件设计和调试; 硬件设计主要包括数据和程序存储器的配置、数据交互通道的设计、控制和显示电路设计、电源转换电路设计和其他外围扩展器件的硬件接口电路设计。以DSP芯片为核心的信号处理系统,可分成2大类。一类是DSP器件处从属地位,受主机控制,主要完成数据的处理并将结果返回给主机工作。另一类是系统在上电后独立运行自成一个系统,系统所有的控制和处理工作都由DSP器件完成。这类系统利用了DSP器件的自举引导功能,将存储在外部的存储芯片的控制和处理程序引导加载到DSP的程序空间,使系统按预定方式工作。系统的硬件设计是软件设计的基础。 (6)软件设计与调试:用DSP汇编语言或C语言或两者混合使用编写系统和各种应用程序,软件设计包括系统软件和信号处理(一般应用)软件。系统软件根据实际需要可包括系统控制软件、人机接口、数据输入,输出管理以及和主机的接口等。信号处理软件主要是编写一些信号处理算法的程序,完成特定的处理功能。DSP系统和主机的接口主要用高级语言编写。软件设计和初步的调试是结合一些开发工具和开发环境来完成的。大多数DSP器件都提供了完善的开发环境,CCS(Code Composef Studio)是本次设计中所用到的DSP开发环境,它是一种TI公司推出的为开发TMS320 系列DSP系统的集成开发环境。 (7)系统集成与测试:完成上述工作,就剩系统的集成和实际的功能测试。DSP系统,涉及到电子电路、各种硬件和软件等各个方面,设计的系统能否达到预期的要求还有待实际测试和检验 典型的DSP系统它的输入信号可以是电信号、声音信号、物理信号、化学信 号、连续信号、数字信号、强信号、弱信号。在前向通道中,经过滤波和采样, 然后通过A/D信号变换成为数字比特流。根据香浓采样定律,采样频率至少必须 是输入信号最低频率2倍。 DSP芯片系统可由一个DSP处理器和外围总线组成,也可以由多个DSP处理器组成,这完全取决于DSP处理器的要求。DSP芯片系统的主要任务是将前向通道输出的信号按照一定的算法进行处理,然后将处理的结果以数据流的形式输给后向通道。 2.2 系统的总体构成 声音信号经A/D转换器采样变成PCM数据,由串口输入DSP芯片内按语言处理算法高速处理。处理结果可由LCD显示出来,或输入到D/A转换器中转换成模拟信号,经出扬声器还原成声音信号。为了适合处理,在语音信号处理之前,先对输入的语音信号进行放大。DSP芯片构成本系统的控制和处理核心,由它来协调各功能模块的工作,利用其快速的运算能力完成语音信号的运算。考虑到需要存放语音处理数据和程序,有必要扩充存储器。用闪速存储器存放语音处理程序和主控制程序。用CPLD实现系统的逻辑控制和DSP芯片的I/O空间的扩展。 2.3硬件系统核心芯片的选择 本系统采用了TI公司于1999年10月推出的一款定点数字信号处理器TMS320C5402,作为系统的主控芯片。美国德州仪器(11)公司子1982年推出通用可编程DSP芯片以来,DSP技术获得突破性发展,已从最初只用于实时大数据量的处理,发展到其应用已覆盖全球各行各业。近年来,随着低价格、高性能DSP 芯片的出现,DSP已越来越多地被应用于高速信号采集、语音处理、图像分析处理等领域中,并且其优越性日益突显。当前业界中应用最广泛的是TI公司的TMS320系列的DSP芯片,其中TMS320VC5402(简称VC5402) ,主要的特点如下:操作速率达100MIPS,单周期指令执行时间是IOms;具有先进的多总线结构,三条16位的数据存储器总线和一条20位的程序存储器总线;40位算术逻辑单元(ALU),包括一个40位桶形移位器和两个40位累加器;一个17x17乘法器和一个40位专用加法器,允许16位带/不带符号的乘法;单周期正规化及指数译码;8个辅助寄存器及一个软件栈,允许使用业界最先进的C语言编译器;数据/程序寻址空间分别为64K×16bit,1Mxl6bit,内置4Kxl6bit ROM和16Kxl6bit RAM,64K×16bit的I/O空间寻址能力;内置可编程等待状态发生器、锁相环(PLL) 时钟产生器、两个多通道缓冲串行口、一个8位并行与外部处理器通信的HPI口、2个16位定时器以及6通道DMA控制器;低功耗,工作电源有3.3v(I/O)和1.8v (内核),O.32MW/MIPS,特别适合电池供电设备。 与TMS320C54X系列的其他芯片相比,它以其独有的运算速度快、低功耗、和高性价比的特点。已在无线调制解调器、机顶盒、下一代个人数字助理、集群电话、局域网电话、各种语音应用等单信道通信客服终端,个人移动通信、信号与信息处理以及自动控制等领域得到了广泛的应用。 VC5402有访问64K×16bit的数据空间、I/O空间以及1M×16bit的程序空间的能力,其内部自带有一定数量的物理存储空间,有16KXl6bit的片内RAM和4Kx 16bit的ROM,对于经常要用到的程序和数据可在系统上电之初由自举引导程序加载放到片内的RAM存储区,提高系统运行速度。DSP对(片内、片外)物理存储器的访问都是通过访问映射存储器来实现的,DSP的映射存储器分为程序区、数据区和I/O区三个区域。I/O区,一般是和片外资源联系在一起才能建立起来,数据区可由片内或片外存储器映射构成。DSP的映射存储器代表了DSP芯片的寻址能力和可访问空间的大小,在没对这些映射存储器配置前,映射存储空间是虚拟的,物理存储器也不可访问。物理存储器和存储空间区域的映射关系的建立, 主要通过VC5402的管脚MP/MC、处理器模式状态寄存器PMST的OⅥ位和DROM位,并配合存储器配置文件完成的。 2.4 实时语音处理的基本要求 (1) 适合乘加操作的算术逻辑单元 (2) 高效率的算法代码和执行硬件 (3) 方便快捷的并行存储结构 (4) 便利的片内外部设备和通用接口 3 设计部分 3.1 设计目的和要求 3.1.1 输入信号为2路语音信号,要求系统能对2路输入信号进行实时采集、数字化处理、压缩、存储(录音),要保证一定的录音质量,录音时间不少于10小时。 3.1.2 根据已知参数对输入信号特征进行分析、需求分析,采用DSP作为控制器,设计实时语音处理系统。 3.1.3 选择确定DSP芯片型号、语音采集芯片型号,完成系统硬件设计。实现对语音信号的实时采集,处理(压缩,编码等)。 3.1.4 给出实时语音处理系统的设计方案,并对所设计的控制程序进行详细说明和描述。 3.2 设计原理 近年来,随着DSP技术的普及和低价格、高性能DSP芯片的出现,DSP已越来越多地被广大的工程师所接受,并越来越广泛地被应用于各个领域,例如:语音处理、图像处理、模式识别及工业控制等,并且已日益显示出其巨大的优越性。DSP是利用专门或通用的数字信号处理芯片,以数字计算的方法对信号进行处理,具有处理速度快、灵活、精确、抗干扰能力强、体积小及可靠性高等优点,满足了对信号快速、精确、实时处理及控制的要求。对实时数字信号处理的应用需求和超大规模集成电路技术水平的飞速发展,推动着DSP性能不断提高。DSP是一种专用的数字信号处理器。随着超大规模集成电路技术上取得的突破进展,高度集成化的DSP数字信号处理器具有体积小、功耗低和运算速度快等诸多优点,因此非常适用于语音信号的压缩处理。基于DSP的实时语音处理系统,它具有可选择的信号采样速率和高性能的数字信号处理能力,不仅可以用来对立体音频信号进行实时编解码处理,还可以用来作为高速的实时信号采集与处理板使用。它包括多路语音实时采集,压缩处理,存储功能等基本功能。 实时语音处理系统中,由于语音的数据量大,运算复杂,对处理器性能提出了很高的要求,适于采用高速DSP实现。虽然DSP提供了高速和灵活的硬件设计,但是在实时处理系统中,还需结合DSP器件的结构及工作方式,针对语音处理的特点,对软件进行反复优化,以缩短识别时间,满足实时的需求。因此如何对DSP进行优化编程,解决算法的复杂性和硬件存储容量及速度之间的矛盾,成为实现系统性能的关键。 3.3 设计内容 3.3.1理论依据 根据设计要求中的要点,所要设计的基于DSP的实时语音处理系统功能是,它能同时输入至少两路音频信号,而且能够对两路输入信号进行实时采集并将模拟信号数字化,然后对信号进行数字信号处理,并能够根据要求存储不少于10小时的录音,最后输出音频信号。那么在设计系统过程中,为满足要求要有信号采集,模/数及数/模转换,数字信号处理部分,包括数据压缩等,电源电路,复位电路,时钟电路。 3.3.2 信号特征分析 音频信号经过高精度高速的ADC转换后得到一串数字信号,分帧输入到波形输入缓冲区RAM。然后由手动控制一种或几种处理算法将音频信号调入TMS320C5402的内部进行高速运算。经过处理的音频信号,再输入到高精度高速的DAC转换器中,还原成模拟的声音信号,经音箱功率放大电路放大输出。 3.3.3 方案设计 系统结构框图: A/D转换 音频信号 放大 DSP芯片 电源 复位电路 D/A转换 音频信号放大 功率放大电路模拟音频信号输出 音频处理程序 存 储 区 EPROM CLKX CLKR DX DR XF TMS320VC5402 音量,音效等的选择,控制 语音信号 输入信号:2路语音信号。音频系统应该具有较宽的动态范围,选择8-16位放大信号能完全捕获或恢复高保真的音频信号。系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402[1](以下简称'C5402)。 DSP芯片模块是整个实时语音处理系统的核心部分,它对经数字化的信号进行压缩,编解码等。 框图分析:模拟音频信号输入,经过放大,滤波之后,由A/D转换器转换后得到一串数字信号,由手动控制或几种处理算法将音频信号调入DSP芯片的内部高速运算。经过处理的音频信号,再输入到高精度高速的D/A转换器中,经过滤波放大,还原成模拟的声音信号,经音箱功率放大电路放大输出。系统中各模块是同时进行处理,一部分信号正在A/D转换器进行转换,而另一部分信号则在DSP处理器中同时进行算法处理,即整个系统是以流水线的方式进行工作的。 框图各模块功能分析: (1)语音信号:输入2路语音信号(8-16位放大信号,要去能完全捕获或恢复高保真的音频信号) (2)音频信号放大:经放大电路放大输入的语音信号 (3)A/D转换器:放大后的音频信号在滤波之后由A/D转换器转换为一串数字信号 (4)DAP芯片处理器:系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402。是整个实时语音处理系统的核心部分,它对经数字化的信号进行压缩,编解码。在其内部进行高速运算,处理 (5)D/A转换器:由DSP芯片处理好的信号由D/A转换器进行转换,经滤波输入到音频信号放大器 (6)音频处理程序存储区EPROM:存储音频处理程序 (7)音量、音效等的选择、控制:选择适当的音量、音效的控制方法 (8)功率放大电路模拟音频信号输出:还原成的模拟声音信号,经音箱功率放大电路放大输出 (9)电源模块;为内部芯片及周边系统电路提供能量来源 (10)复位电路:确保此方案的电路稳定工作,复位电路必不可少。功能:上电复位 3.3.4 方案论证 本设计的系统采用DSP芯片作为控制器,要求输入信号为2路语音信号,保证一定的录音质量,录音时间不少于10小时,实现对语音信号的实时采集、处理(压缩,编码)等,编写DSP控制程序,实现对语音信号的实时。 具体实现过程:首先,模拟音频信号输入,经过放大滤波之后,由A/D转换器转换后得到一串数字信号,由手动控制或几种处理算法将音频信号调入DSP芯片的内部高速运算。经过处理的音频信号,再输入到高精度高速的D/A转换器中,经过滤波放大还原成模拟的声音信号,经音箱功率放大电路放大输出。 DSP芯片采用美国TI公司的TMS320VC5402作为核心芯片,复位电路所用芯片为74HC14. 软件设计主要包括DSP编程和PC编程。DSP编程主要任务是初始化。管理板上的资源和完成音频的处理算法。PC编程则是管理DSP操作和应用层软件的编写。语音的传输过程涉及到了采样、编码、分割、压缩、打包、传送、重组、合成、回放等处理,每种处理都需要相关的设备和具体的应用程序,每种处理涉及到的语音数据形式不尽相同。语音信号的输出和存储是语音信号的基本要求。对语音信号的传输,希望是传输的速度尽量快,传输质量尽量高;对语音信号的存储,希望存储的空间尽量小,存储的信息尽量多。语音信号具有信号频谱较全、采样速率较低、随机性强、应用场合多、实时性要求高等特点。语音信号的处理包括信号采集、处理、存储和播放这一系列的处理过程。其中,语音信号的采集、传输和播放属于对语音信号的控制,其处理过程满足一定的标准操作即可;而语音信号的处理和存储与应用对象有很大的联系,不同的应用对象所要求的处理算法和存储算法不同。 3.3.5 器件选型(硬件电路的设计) 高保真的音频系统应具有较宽的动态范围。选择8-16位的A/D,D/A能完全捕获或恢复高保真的音频信号。 系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402(以下简称C5402)。 (1)DSP芯片: 作为DSP家族高性价比代表的16位定点DSP芯片,C5402适用于语音通信等实时 嵌入应用场合。与其它C54X芯片一样,C5402具有高度灵活的可操作性和高速的处理能力。其性能特点如下:操作速率可达100MIPS;具有先进的多总线结构,三条16位 数据存储器总线和一条程序存储器总线;40位算术逻辑单元(ALU),包括一个40位桶形移位器和两个40位累加器;一个17×17乘法器和一个40位专用加法器,允许16位带/不带符号的乘法;整合维特比加速器,用于提高维特比编译码的速度;单周期正规化及指数译码;8个辅助寄存器及一个软件栈,允许使用业界最先进的定点DSP C语言编译器;数据/程序寻址空间为1M×16bit,内置4K×16bit ROM和16k×16bit RAM;内置可编程等待状态发生器、锁相环(PLL)时钟产生器、两个多通道缓冲串口、一个与外部处理器通信的8位并行HPI口、两个16位定时器以及6通道DMA控制器且低功耗。与C54X系列的其它芯片相比,5402具有高性能、低功耗和低价格等特点。它采用6级流水线,且当RPT(重复指令)时,一些多周期的指令就变成了单周期的指令;芯片内部RAM和ROM可根据PMST寄存器中的OVLY和DROM位灵活设置。这些都有利于算法的优化。 C5402采用3.3V和1.8V电源供电,其中I/O采用3.3V电源供电,芯片的核采用1.8V电源供电。而实际常用的只有5V电源,所以必- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DSP 实时 语音 处理 系统 设计
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【xrp****65】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【xrp****65】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【xrp****65】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【xrp****65】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文