团员分享_教育场景中的语音测评_@加薪_20200603
2020年5月27日 更新
开启更多功能,提升办公效能

前言:本文是团员“加薪”的第1篇输出文章;也欢迎有更多的团员们来分享你的AI干货~


在饭团潜水一年,时间久了,也有想浮出水面的冲动,因为进入AI语音行业不算太久,饭团内已经有大量语音识别、语音合成分享文章了,硬核男人总怕跟别人与众相同,哈哈哈~ 今天,我来分享下在教育行业得到大量运用的语音测评技术。


一、语音评测的定义和分类

1、语音评测是啥腻——

  • 语音评测又称口语评测技术、口语自动评估技术,通俗来说,就是利用计算机辅助语言学习(Computer Assisted Language Learning),是一种通过机器自动对发音进行评分、检错并给出矫正指导的技术。
  • 通过该技术,可以用计算机对普通话或者英语的发音进行标准评价和错误反馈指导。尤其在英语口语教学中,能有效地提高学生口语学习的效率和效果。


2、语音评测目前常见分类有两种:朗读评测、口头表达评测

  • 朗读评测:限定文本,重点考察发音水平,也是市面上比较常用的评测使用方式。
  • 口头表达评测:非限定文本,重点考察表达正确性、流畅性、完整性。需要识别语音的内容,提取主要内容进行评分。


3、主要区别

  • 技术区别:朗读评测是不需要进行自然语言处理的;两种评测都用到了声学模型。
  • 评测结果区别:朗读评测不能代表一个评测者的语言能力,而口头表达可以更细致的查看评测者的语言语法、内容丰富程度、语言的掌控能力。相对来说是较好的评测方式。



二、朗读评测



简单理解就是:

录入音频>>特征提取>>特征处理>>监测错误、对比模型打分>>输出结果


举个🌰栗子:

1、你对评测引擎说一段话“男人的浪漫”,在收集到以上一段语音内容后,引擎会首先特征提取,对因素序列切分因素边界



2、利用声学模型计算每个音素的后验概率(GOP),引擎给你返回结果经过对比“男”、“人”、“的”、“漫”的概率都是0.9,只“浪”后验概率为0.1。这并不说明你是个不够“浪”的男人。而是说明你这个男人“浪(lang)”发音不标准


3、接下来系统会告诉你,“浪”都发音不标准(及对应的打分分数),你又怎么出去浪呢。你快回去练练吧。目前市面上的应用多数只到纠错上。很少有即给你纠了错,又告诉你怎么改。


4、应用公式:

贝叶斯公式



因素检测决策方法:

  • 模型法:使用二分类模型,判断正确或错误
  • 门限法:依据门限(阈值)控制判断错误

因为模型法训练需要大量的真实的发音错误训练数据,同时对真实的发音错误数据进行标注训练,成本较高,所以大多都使用门限法。门限法因为可控标准,对不同的业务需求也有较好的灵活性。


5、现阶段可实现的评分维度:

  • 准确度:是否发音正确。根据后验概率计算,数值越大越准确
  • 流畅度:是否发音流畅。根据语速、增读比例、不当停顿比例进行描述
  • 完整度:是否读音完整。根据漏读比例进行计算
  • 发音:是否读音标准、准确。
  • 连读:是否连读。
  • 重音:是否反复读一个词。
  • 重(chong二声)读:是否有重音,英文发音时,有些就是需要强调重音发音需要对特定的语料进行标记。
  • 语调:语调是否偏误,比如同一句话,陈述句和疑问句语调是不同的需要对特定的语料进行标记。


6、模型映射:


7、映射模型:

  • 线性回归:s=wx+b
  • 非线性回归:决策树、svm、nn



三、口头表达评测



1、口头表达的评分维度

  • 词汇及语法使用能力:使用是否多样准确
  • 内容丰富程度:内容是否饱满
  • 表述流畅:流畅程度、表述正确读
  • 发音质量:同阅读评测标准


2、口头表达评测的基本原理和朗读测评还是很相近的,区别较大的点在于,口头表达需要评测内容丰富程度,要有量大话题的数据,进行大量监督学习模型训练 。最好使用半监督的方式,通过一部分的数据训练让机器自动后续的模型优化。


3、口语评测的应用:


目前评测技术已经比较完善了,可以支持中英文朗读、主观表达评测,主要的几个应用场景:

  • 作业场景:比较典型的产品一起作业、作业帮
  • 课前预习、课后复习场景:51Talk、VIPKID
  • 口语考试:外研社、E听说


最后,在饭团学习1年,今年最后有机会转型加入了AI部门,我自己的感受是,如果学习久了,动力确实不如开始的时候,现在回想刚接触AI时,转型这段时间是我做产品这一路上最畅快的时刻爱你所爱,行你所行有机会,社群内小伙伴们可以多交流指教。


 

-END-

 

以上内容,来自饭团“AI产品经理大本营”,点击这里可关注:http://fantuan.guokr.net/groups/219/ (如果遇到支付问题,请先关注饭团的官方微信服务号“fantuan-app”)

 

 

---------------------

作者:黄钊hanniman,图灵机器人-人才战略官,前腾讯产品经理,7年AI实战经验,10年互联网背景,微信公众号/知乎/在行ID“hanniman”,饭团“AI产品经理大本营”,分享人工智能相关原创干货,200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。