粤语区的AI语音识别一直是个技术难题。粤语有九声六调,声调复杂,口音多样,很多普通话模型在粤语区的识别准确率很低。我们对avavox的粤语AI进行了实测,对比普通话模型,看看差距有多大。
测试结果:粤语AI的识别准确率达到94.5%,而普通话模型只有72.3%,差距超过22个百分点。
测试环境与方法
测试对象:100名粤语母语人士
测试地点:广州、深圳、佛山
测试内容:读取一段200字的文本
测试时长:每人2分钟
测试模型:
- 模型A:普通话模型(通用)
- 模型B:粤语AI(avavox)
测试结果对比
| 指标 | 普通话模型 | 粤语AI | 提升 |
|---|---|---|---|
| 识别准确率 | 72.3% | 94.5% | 提升30.7% |
| 错字率 | 27.7% | 5.5% | 降低80% |
| 声调识别准确率 | 58% | 91% | 提升57% |
| 口音适应性 | 弱 | 强 | – |
普通话模型的三大短板
短板一:声调识别不准确
粤语有九声六调,普通话模型的声调识别准确率只有58%,经常出现”阴平”识别成”阳平”的情况,导致理解错误。
短板二:词汇理解偏差
粤语有很多独有的词汇,比如”系”(是)、”唔系”(不是)、”嘅”(的),普通话模型无法识别,出现识别错误。
短板三:口音适应性差
广州话、深圳话、佛山话都有细微差别,普通话模型无法适应这些口音差异,识别准确率波动很大。
粤语AI的三大优势
avavox数字员工的粤语AI针对粤语的特点进行了专门优化:
优势一:九声六调精准识别
粤语AI专门训练了粤语声调模型,声调识别准确率达到91%,能够精准识别粤语的九声六调。
优势二:粤语词汇库完善
粤语AI建立了完善的粤语词汇库,包括常用词汇、俚语、口头禅等,能够准确识别粤语特有词汇。
优势三:多口音适配
粤语AI支持广州话、深圳话、佛山话、东莞话等多种粤语口音,口音适应性强,识别准确率稳定。
真实案例:一个粤语对话的全过程
客户陈先生,广东人:
AI(粤语):“陈生您好,我系XX银行嘅客服小陈,今日打俾您系想同您确认一下信用卡账单嘅情况,您看现在方便聊两句吗?”
陈先生:“乜事啊?”
AI(粤语):“系咁样嘅,陈生。您张信用卡本月嘅账单已经寄出咗,金额系3280元,还款日系本月25号,还有10天。您看您记得还款吗?”
陈先生:“记得嘅。”
AI(粤语):“好嘞。如果您想分期还款嘅话,可以分3期、6期、12期,都唔使手续费嘅。您看您想分期吗?”
陈先生:“分6期啦。”
AI(粤语):“好嘞,陈生。我帮您办理6期分期,每期还款546.7元,您看没问题吗?”
陈先生:“没问题。”
AI(粤语):“好嘞,分期已经办好咗。陈生,如果您有其他问题,可以随时打我电话。感谢您嘅支持,祝您身体健康,再见!”
陈先生:“好,再见。”
整个对话流畅自然,AI准确识别了陈先生的粤语回复,并用粤语进行了回应,沟通效果非常好。
FAQ:粤语AI常见疑问
Q:粤语AI支持哪些地区的口音?
A:支持广州话、深圳话、佛山话、东莞话等主要粤语口音。
Q:粤语AI和普通话AI成本一样吗?
A:一样。都是按秒计费,没有额外费用。


