语音识别开发板ws-117语音ic

品牌 ws 型号 117
批号 0 封装 csp100
 ws-117语音识别模块

        ----------最多支持1000条词条识别      

一、ws-117简介

      ws-117硬件模块是一款利用公司第二代语音处理芯片(dsp芯片)开发的非特定人语音识别的开发应用平台,支持mp3、wma等格式音频文件的解码和播放。可用于智能控制等诸多领域。ws-117模块可以通过多个接口与主机进行通信。

    ws-117支持中文、英文语音的识别控制,并允许用户进行关键词和关键句的更新维护。通过预先定义的通讯接口,主机可以控制ws-117的识别内容以及识别流程。

    ws-117可以支持多达1000词条的中文语音识别,识别词条所支持的字数最大为6个汉字,对于非易混词表,系统给出的识别率达到97%以上(系统可以给出3个候选结果)。系统支持在噪音环境下的语音识别,芯片中加入了专门的滤波模块。

二、ws-117架构说明

      ws-117模块作为一个协处理器,含有mic、内置adc、speaker喇叭、dsp芯片,可以外扩sd卡或者tf卡。mic、内置adc采集语音(录音)。host主机将语音识别词条列表生成hmm网格文字,然后导入到dsp芯片中,并存储在外扩的sd卡或者tf卡中(同时mp3等音频文件也可以存储在卡中)。dsp芯片对录制的语音进行处理,识别后将识别结果(3个候选结果)通过相应的接口反馈给host,再有host执行相应的动作,dsp芯片还可以作为音频的解码器,播放mp3等音频文件。

三、ws-117使用流程说明

l     host的工作

host主机将语音识别词条列表生成hmm网格文字,然后导入到dsp芯片中,并存储在外扩的sd卡或者tf卡中。

将用户自定义的待识别词条(中文简体)转化为网格文字,具体的转换过程和对dsp的操作我们会相应的链接库和api供客户运行在host中。

对host的要求如下:

1、       支持c语音编译。

2、       支持最简单的fat16/32的文件系统。

3、       资源的消耗程度:支持mp3播放和语音识别,code部分大概在180kb、ram部分不小于800b;仅支持语音识别,code部分在120kb、ram部分不小于800b。

4、 host和dsp的通信接口:spi接口或者并口。