![]() |
| 政务区 >> 最新关注 |
|---|
![]() |
| 电信级分布式语音识别系统 | ||
由中国科学院声学研究所等单位完成 |
||
该项目旨在解决人机语音交互的关键技术问题,重点解决在实际应用环境下语音识别技术、音乐检 索技术对噪声、信道和口音的稳健性等难题,具体研究内容及创新点有:针对电信应用复杂多变的噪声环境,提出了基于自适应子带能量和谐波检测的高性能端点检测算法。提出了基于混淆矩阵的两遍音素聚类算法,并在此基础上实现了支持中英文混合语音的双语识别技术。实现并改进了基于MPE准则的声学模型训练技术,提高了系统的识别率。提出了基于状态网络的Cross-word静态搜索空间构建方法,有效地单遍集成除语言模型之外的所有知识源;通过将词典组织成音素网络结构,并通过充分的前向后向归并算法以及在状态层次优化网络,消除搜索空间的冗余。提出了基于语音识别的歌词检索技术。提出了完整的基于哼唱的音乐检索方法和理论。 |
||
| <关闭本页> |