积分规则 网站地图 帮助中心    
嵌入式软件 单 片 机 DSP 存储器 传感控制 光电显示
嵌入式硬件 CPLD/FPGA SOPC AD/DA 接口电路 模拟设计
I C设计 通信产品 汽车电子 电源产品 消费电子 数控系统
工业控制 军工/航天 安防产品 医疗电子 计算机外设 测试测量
供应 I C
求购 公司库

  IC 求购 销售 公司 论文 DATASHEET 参考设计 论坛
当前位置: 电子技术 >> DSP >> 应用论文
  相关分类: 应用论文 | TI DSP | 新产品 | 算法 | 下载 | DSP代码示例 | ADI DSP | freescale DSP |
基于TMS320VC5509A的语音识别与控制系统
 
作者:关胜平,何培宇,刘珂含,李 锦,田芳芳,王三山   来源:电子技术应用    点击数:181   更新时间:2008-7-17
您可以添加到网摘 让更多人关注此文章:

        语音识别(Speech Recognition)是机器通过训练和匹配过程把语音信号转变为相应的文本或命令的技术。关于语音识别技术,先后出现了动态时间弯折(DTW)、隐马尔可夫和人工神经网络三种主要方法[1]。由于每种方法都涉及大量的乘加运算,并且计算精度是算法性能的有效保障,因此对处理器的运算能力要求较高。近年大规模集成电路的快速发展,为语音识别的实现创造了硬件条件。目前,基于DSP的语音识别系统多以浮点型DSP为主[2],但其成本较高。本文以TI公司的较低成本定点DSP TMS320VC5509A作为处理芯片。在软件编程时,考虑运算速度和精度对性能的影响,将定点运算与基于定点DSP的浮点运算巧妙结合,既保证了处理速度,又提高了运算精度和识别率。此外,该系统的DSP芯片自带USB接口,可使程序下载不借助于硬件仿真器,便于推广应用;可编程逻辑器件(CPLD)能够根据识别结果发出相应的控制信号以驱动各种控制对象;外扩Flash达1M×16Bit,不仅能存储较多数量的模板,也可实现程序的并行加载,使系统能够脱机运行,便于携带。通过对语音信号的采集与识别,能够完成对特定人、小词汇量、孤立词的识别,并且能发出相应的控制信号,以达到系统的设计要求。实践验证了该系统具有可靠性、稳定性和灵活性。
1 语音识别原理
    语音识别原理框图如图1所示。语音信号输入之后,预处理和数字化是进行语音识别的前提条件。其中,预处理主要是进行预滤波,保留正常人的300~3400Hz的语音信号;数字化是要进行A/D转换及抗混叠等处理;特征提取是进行语音信号训练和识别必不可少的步骤。能够体现语音信号特征的参数包括:(1)基于LPC的倒谱参数;(2)Mel系数的倒谱参数;(3)采用前沿数字信号处理技术的特征分析手段,如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表示方法,提取出的特征值存入参考模式库中,用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分,由待识别人的语音经过特征提取后,与系统训练时产生的模板进行匹配,在说话人辨认中,取与待识别语音相似度最大的模型所对应的语音作为识别结果,这就是语音识别的整个过程[1]

 


                      



2 硬件结构部分
    本系统的硬件结构框图如图2所示。


 


                          



    此系统的核心器件是TI公司的TMS320VC5509A定点DSP芯片。它是系统的运算处理单元,具有2个乘法器(MAC),4个累加器(ACC);40位、16位的算术逻辑单元(ALU)各一个,这大大增强了DSP的运算能力;指令字长不只单一的16位,可扩展到最高48位,数据字长16位;在144MHz下工作,指令周期可达6.94ns。TMS320VC5509A还提供高速的多通道缓冲串口McBSP(Multi-channel Buffererd Serial Ports),DSP可通过McBSP与其他DSP、编解码器等器件相连。McBSP具有全双工通信,双缓冲数据寄存器,允许传送连续的数据流,能够向CPU发送中断,向DMA控制器发送DMA事件,可设置帧同步脉冲和时钟信号的极性等功能,这大大方便了DSP采集音频信号[3]。除此之外,TMS320VC5509A还提供了更为高效的外部存储器接口(EMIF),以往DSP的空间选通信号被片选信号取代,而每个片选信号分别占用不同的地址空间,这样就不需要外部的译码电路,从而实现了与外部设备的无缝连接,可使DSP外部存储空间扩大到满足系统要求。值得强调的是,可通过USB接口对TMS320VC5509A烧写程序而不必借助仿真器。正是基于这些优点,选择该芯片可节省开发资金,减小电路板面积。
    TLV320AIC23是TI公司的一款低成本、低功耗的音频编解码芯片(CODEC),在本系统中负责采集语音信号。它与本系统相关的性能参数如下:(1)支持8kHz~96kHz可调采样率;(2)与DSP连接,主从类型可通过软件编写来实现;(3)DSP可通过I2C总线来配置TLV320AIC23的寄存器;(4)采集语音信号字长16/20/24/32Bit;(5)MIC音频输入具有强抗噪性;(6)具有可调1~5dB的完整缓存放大系统[4]
    EPM3128ATC100-10可编程逻辑器件(CPLD)在本系统中担当两方面的职能:(1)作为控制部件,接收DSP发出的信号,经逻辑判断后,驱动诸如电机、发光二极管等器件;(2)用于DSP地址线的扩展。TMS320VC5509A只有14根地址线,但它的外部存储空间可以扩展到16MB(字节寻址),显然,DSP的固有地址线是无法满足要求的。本系统采用CPLD完成地址线的扩展[5][6]
HY57V641620同步动态存储器(SDRAM),容量为4M×16Bit。作为RAM的扩展,大大增强了DSP的存储与运算能力[7]
    SST39VF1601闪存存储器(Flash),容量为1M×16Bit。在这个系统中[8],它主要用来存储程序代码。上电后,DSP从外部Flash加载并执行程序代码,使系统能够脱机运行。
3 软件模块部分
    软件流程如图3所示。系统采集语音信号后,首先要进行预滤波和预加重;接着将语音信号进行分帧,由于语音信号具有极强的相关性,因此在分帧时,要考虑帧重复。本文将语音信号以256个采样点为一帧,两帧之间的重复点数为80;然后计算每帧信号的短时能量与短时平均过零率,这也是接下来进行端点检测的依据;利用门限判决进行端点检测后,提取每帧信号的LPC系数,作为该帧信号的特征值;最后,用语音信号的特征值与模板逐个进行匹配。相似度最大的模板所对应的语音信号为识别结果,根据识别结果就可以向外发出控制信号。


 


                          


[1] [2]  下一页



相关文章
· DSP与PC机的无线交换调制模块设计[321]
· ARM CPU S3C44B0X与C54X DSP的接口设计[105]
· 利用双处理器延长电池使用寿命[155]
· 基于C语言设置TMS320 DSP中断向量表[123]
· 用FPGA构成液晶显示控制器[142]
热门评论排行
·VHDL设计中电路简化问题的
·江苏嵌入式Linux教育培训
·锐极LINUX驱动培训班定于
·基于实时操作系统μC/OS-
·ARM嵌入式系统基础教程(N

文章评论
    没有任何评论
*只显示最新10条评论。评论内容只代表网友观点,与本站立场无关。更多评论
发表评论
  * 请先[登陆]再进行评论,谢谢。
评分: 1分 2分 3分 4分 5分
内容: *
发帖须知:
一.所发文章必须遵守《互联网电子公告服务管理规定》;
二.严禁发布供求代理信息,公司介绍,产品信息等广告宣传信息;
三.严禁恶意重复发帖;
四.严禁对个人,实体,民族,国家等进行漫骂,污蔑,诽谤。
 
热点新闻 [更多]
 
赛普拉斯为用于机器视觉与运动分析应用
赛普拉斯针对机器视觉与全息数据存储应
金融危机来袭 台湾LED产
半导体市场环境恶化 安森美
Vishay 的新型&nb
Intersil推出采用小尺寸QFN
富士通微电子携手西安电子科技大学成立
纤巧和高压的 LDO&nb
华为计划收购北电业务 华为
华为计划收购北电业务 华为
 
热门下载 [更多]
 
[ PCB设计] Protel99教程下载
[ ] 手把手学单片机20个例
[ ] 单片机做的智能台灯
[ ] 单片机入门书
[ ] linux系统移植开发文档
[ ] IC卡的读写程序
[ ] 8051单片机C语言彻底应用
[ 常用软件] 555定时器电路设计软件V1.2
[ 常用软件] 51定时器计算软件
[ ] ARM处理器应用开发4步骤
 
论坛新帖 [更多]
 
四折批发各种数码相机,摄相机等...
最低价销售各种品牌手机...
震撼出售各种品牌笔记本电脑等!...
IC design 的流程...
电子工程师,别拿一分钱不当回事...
新款安全多用途非接触式芯片(T...
关于ARM启动的一篇文章!...
Linux网络设备驱动编程...
linux文件系统基础知识...
求奇想达QXD-DM642开发...

 
赞助商 [更多]
 

ICP许可证号:[粤 05056597]
联系电话:010-82517432 82517615 传真: 010-82517615

版权所有 Copyright © 2006 嵌入式技术网