基于LD3320的嵌入式聚星平台app语音辨认体系计划

2021-11-18 17:59 聚星平台

  择要:语音交互体系是较量人道化的人机操纵界面,它必要语音辨认体系的支持。LD3320就是这样一款语音辨认芯片。先容了该芯片的事变道理及应用,给出了LD3320与微处理赏罚器的硬件接口电路及软件措施。跟着高等MCU的不绝呈现,以MCU为焦点的嵌入式语音交互体系会有很是好的应用远景。

  1 概述

  在当代社会,“懒人科技”大行其道。对面对浩瀚繁琐的按键操纵和菜单选择的时辰,简朴地说出指令,是最具有情面味的人机操纵界面。让身边的各类电子装备可“功用”人类的语音,是从影戏“星球大战”就开始的科技成长方针。固然今朝的科技还不能做到让计较机完全领略人类的全部天然语音,可是可以在必然水平上实现这个空想。

  2 特定人语音辨认技能及道理

  特定人语音辨认(ASR,Auto Speech RecogniTIon)技能是基于“要害词语列表”的辨认技能,它是对大量的语音数据(相等于对数千人收罗的数万小时的有用声音数据)经说话学家语音模子说明,成立数学模子,并颠末重复实习提取基元语音的细节特性,以及提取各基元间的特性差别,获得在统计概率最优化意义上的各个基元语音特性,最后才由资深工程师将算法以及语音模子转换成硬件芯片并应用在嵌入式体系中。

  ASR技能每次识此外进程就是把用户说出的语音内容,通过频谱转换为语音特性,再将这个转换后的语音特性和“要害词语列表”中的条目逐一举办匹配,最优匹配的一条即作为辨认功效。好比ASR技能在语音节制的手机应用中,这个“要害词语列表”的内容就是电话本中的人名、手机的菜单呼吁或手机存储卡中的歌曲名字。岂论这个列表的条目内容是什么,只必要用户配置相干的寄存器,就可以把响应的待辨认条目内容以字符情势转达给辨认引擎。

  由此可见,语音辨认芯片完成的事变就是:把MIC(麦克风)输入的声音举办频谱说明后提取语音特性,再和要害词语列表中的要害词语举办比拟匹配,最后找出得分最高的要害词语作为辨认功效输出。

  凡是基于ASR技能的语音辨认芯片能在两种环境下给出辨认功效:

  ①外部送入预按时刻的语音数据(好比5 s的语音数据),芯片对这些语音数据运算说明后,给出辨认功效。

  ②外部送入语音数据流,语音辨认芯片通过端点检测(VAD,Voice AcTIvity DetecTIon)技能检测出用户遏制措辞,把用户开始措辞到遏制措辞之间的语音数据举办运算说明后,给出辨认功效。

  对付第一种环境,可以领略为设定了一个按时灌音(如5 s的语音数据),芯片在5 s后会遏制把声音送入辨认引擎,而且按照已送入引擎的语音数据计较出辨认功效。

  对付第二种环境,必要相识VAD的事变道理:VAD技能是在一段语音数据流中,判定出哪个时刻点是人声音的开始,哪个时刻点是人声音的竣事。判定的依据是,在配景声音的基本上有了语音发音,则视为声音的开始。尔后,检测到一段一连时刻的配景音(好比 600 ms),则视为人声措辞竣事。通过VAD判定出人声措辞的地区后,语音辨认芯片会把这时代的声音数据举办辨认处理赏罚,计较出辨认功效。

  除了以上两种环境外,语音辨认算法无法“主动”地判定出是否辨认出了一个功效。这是由于,在计较进程中的任何时候,语音辨认器城市对已送人辨认芯片的声音数据举办说明,并按照匹配水平为辨认列表中的要害词语举办打分,最匹配的打分最高。可是,因为辨认算法不知道用户后头是否还继承措辞,以是无法主动地判定已经辨认出的功效。

  3 语音辨认芯片LD3320的事变道理

  3.1 语音辨认体系道理布局

  LD3320语音辨认芯片回收的就是ASR技能,图1就是由LD3320和单片机(或嵌入式体系)构成的语音辨认体系道理框图。图中给出了LD3320的内部道理布局,本文中选用的MCU是STC10L08XE单片机。

  

图1 语音辨认体系道理框图

  图1 语音辨认体系道理框图

  语音辨认芯片LD3320是ICRoute公司的产物,它回收ASR技能,提供了一种离开按键、键盘、鼠标、触摸屏等GUI操纵方法且基于语音的用户界面VUI(Voice User Interface),使得用户对该体系的操纵更简朴、快速和天然。

  用户只必要把识此外要害词语以字符串的情势传送进芯片,即可以在下次辨认中当即见效。好比,用户在 51等主控MCU的编程中,简朴地通过配置芯片的寄存器,把诸如“你好”这样的辨认要害词语的内容动态地传入芯片中,芯片就可以辨认所设定的要害词语了。每个要害词语可所以单字、词组、短句可能任何的中文发音的组合。基于LD3320的语音辨认体系可以跟着行使流程,在运行时动态地变动要害词语列表的内容,这样可以用一个体系支持多种差异的场景,同时也不必要用户作任何的灌音实习。

  3.2 LD3320的用户行使模式

  LD3320有两种用户行使模式,即“触发辨认模式”和“轮回辨认模式”。用户可以通过编程,配置两种差异的用户行使模式。