2024通义语音AI技术图景,大模型引领AI再进化
出处:
mp.weixin.qq.com
作者:
通义语音团队
语音识别服务除了语音识别声学模型以外,还包含很多对于实践应用非常关键的技术模块:语音端点检测、标点预测、逆文本正则化(ITN)等。进一步的,语音识别声学模型也包含很多配套的子技术模块,例如热词定制化技术、时间戳预测等。本小节会介绍通义实验室过去一年在语音识别声学模型、语音端点检测、语音识别热词定制化和时间戳预测上最新的研究和应用进展。
查看原文
76
技术
lddgo
分享于
2023-12-29