语音识别开发板ws-117语音ic
品牌 |
ws |
型号 |
117 |
批号 |
0 |
封装 |
csp100 |
ws-117语音识别模块
----------最多支持1000条词条识别
一、ws-117简介
ws-117硬件模块是一款利用公司第二代语音处理芯片(dsp芯片)开发的非特定人语音识别的开发应用平台,支持mp3、wma等格式音频文件的解码和播放。可用于智能控制等诸多领域。ws-117模块可以通过多个接口与主机进行通信。
ws-117支持中文、英文语音的识别控制,并允许用户进行关键词和关键句的更新维护。通过预先定义的通讯接口,主机可以控制ws-117的识别内容以及识别流程。
ws-117可以支持多达1000词条的中文语音识别,识别词条所支持的字数最大为6个汉字,对于非易混词表,系统给出的识别率达到97%以上(系统可以给出3个候选结果)。系统支持在噪音环境下的语音识别,芯片中加入了专门的滤波模块。
二、ws-117架构说明
ws-117模块作为一个协处理器,含有mic、内置adc、speaker喇叭、dsp芯片,可以外扩sd卡或者tf卡。mic、内置adc采集语音(录音)。host主机将语音识别词条列表生成hmm网格文字,然后导入到dsp芯片中,并存储在外扩的sd卡或者tf卡中(同时mp3等音频文件也可以存储在卡中)。dsp芯片对录制的语音进行处理,识别后将识别结果(3个候选结果)通过相应的接口反馈给host,再有host执行相应的动作,dsp芯片还可以作为音频的解码器,播放mp3等音频文件。
三、ws-117使用流程说明
l host的工作
host主机将语音识别词条列表生成hmm网格文字,然后导入到dsp芯片中,并存储在外扩的sd卡或者tf卡中。
将用户自定义的待识别词条(中文简体)转化为网格文字,具体的转换过程和对dsp的操作我们会相应的链接库和api供客户运行在host中。
对host的要求如下:
1、 支持c语音编译。
2、 支持最简单的fat16/32的文件系统。
3、 资源的消耗程度:支持mp3播放和语音识别,code部分大概在180kb、ram部分不小于800b;仅支持语音识别,code部分在120kb、ram部分不小于800b。
4、 host和dsp的通信接口:spi接口或者并口。