击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”

发布时间:2018-01-02 07:41:40
摘要:2017年被称为阿里云的产业AI之年,ET大脑在城市、司法、工业等领域快速落地。

阿里云ET大脑获得世界互联网领先科技成果奖,阿里巴巴集团CEO张勇发布并领奖。

文/ 天下网商记者 孙茜茜

编辑/ 翁菲

阿尔法狗击败李世石,阿里云人工智能ET击败金牌速记员

2016年3月23日,一场人机大战在阿里云的年会上上演了。

在阿里云总裁胡晓明演讲环节,来自阿里iDST团队的“实时语音识别系统”对战常伴马云身旁的金牌速记师姜毅,分别给出演讲的文本内容,同时投屏,现场PK正确率。

姜毅在阿里云的同学们眼中是这样一种存在:“神一般的速录师,拥有超人的短时记忆功能,超级的打字速度和惊人的正确率”。

姜毅曾在世界速记比赛中获得亚军,他能够在演讲者每分钟300字的语速下, 边听边打字, “话音落、字体现”。

阿里云的同学算了一笔账,每秒钟除标点符号、回车、删除、注释外,他能敲5个字。“按照平均一个字敲4次键盘来说, 也就是每秒钟20次的敲击速度!同时还能在各种干扰下保证九十几以上的正确率!”

双方PK了7分50秒,“实时语音识别系统”最终以0.67%险胜。

iDST语音技术总监鄢志杰说,速记员更加信达雅,但人类很难持续保持更长时间的高强度脑力劳动。机器虽然犯一些语义理解上的错误,但是可以一字不落地记录下讲话内容。并且,在电路通畅的情况下,机器可以工作24小时。

iDST语音技术总监鄢志杰

ET入驻法院,当起了书记员和法官的“小助手”

对法庭中的书记员来说,他们是否有速记跟不上法庭节奏的痛点?“实时语音识别系统”是否能够提供帮助?不久后,这项技术被引入了浙江高院。

据《人民法院报》报道,2016年5月,浙江高院率先开发启用智能语音识别系统,使用人只要点击事先安装在电脑桌面上的软件即实现“一键开启”。软件预先设置角色,语音文字转换时自动注明发言人角色,自动区分庭审发言对象及发言内容。

2016年6月7日上午,西湖区人民法院作为浙江高院智能语音识别系统试点,完成了首例庭审语音同步转化为文字并生成庭审笔录的案件,准确率达96.2%。

西湖区人民法院庭审现场

早在2015年11月,浙江省高院与阿里就签署了战略合作框架协议,双方共同开展云计算和大数据相关领域的技术与应用研究,实现新一代信息技术与浙江审判执行工作各领域的深度融合。2016年9月13日,浙江省高院宣布,将在全省105家法院全面上线智能语音识别系统。

据悉,目前阿里云人工智能ET已经为全国近300家法院、超过6000个法庭提供庭审语音转写服务。

2017年12月6日,福建省高级人民法院正式引入ET。以智能语音为切入点,将语音识别与大数据分析结合,挖掘司法大数据的价值,推进审判体系和审判能力现代化。

福建省高级人民法院与阿里战略合作签约仪式

据悉,除了对庭审过程进行“原汁原味”的记录外,ET将担任法官“小助手”。结合语音文本、判决文书、历史案例库等相关文本数据,通过大数据挖掘、文本挖掘、机器学习建模技术等,提供相似案例的分析与检索、案情建模、案由提取、争议点挖掘、智能预判等,协助法官判案,最大限度消除或减少“同案不同判”的现象发生。

数千家智慧法庭是一夕之间冒出来的吗?

数千家智慧法庭是一夕之间冒出来的吗?鄢志杰说,不是的,这离不开技术的成熟度和积累。

单就语音技术而言,阿里从2014年起就非常严肃地在做投入了,不管是人才、数据还是计算上的投入。“技术、算法,最核心的是离不开操作的人,要不断去优化、再定义它。”

鄢志杰表示,阿里云不是把市场上别人的解决方案集成到阿里云的系统中,而是从麦克风的源头开始做技术。因为“只有这样,才能做到跟语音识别系统打通、实现联合优化;只有这样,才能确保识别的精准度。”

“我们不需要从麦克风采购做起,我们做所有的采购系统的集成。”

用户在使用产品的过程中,技术问题会一个个冒出来。比如,原告面前的麦克风能收到被告从喇叭扩出来的声音。“我们就是专注于解决这样的问题。” 鄢志杰说,大家在整个链条中各司其职,“这样,我们也更专注”。

“语音识别真正要遍地开花的时候,需要特别高效的定制能力。” 鄢志杰表示,比如怎么在保证数据安全的情况下,提高带有口音的普通话、方言的准确识别率?

除了语音识别系统,阿里云附带提供定制平台。在定制平台上,通过对方言语料的模型进行学习和运算,ET能够将方言的识别准确率从40%-50%优化到80%-90%。这样,基层法院也可以享受到ET带来的便利。

在鄢志杰看来,今天很多人谈论自然语言理解,很多时候是为搜索引擎时代的打字去做理解,而自然语言理解,尤其是口语理解的技术,非常重要。

“我们现在跟语音在一起,一定是包含了语音里的口语化现象。比如,语气词、停顿、犹豫等。在这种情况下,是不是还能做到很好的理解?”

鄢志杰表示,自己的团队基于阿里云的基础设施,搭建起了整套的、云端的、超大规模的、语音的声学模型和语言模型的训练系统。数十万小时的数据可以在非常快的时间内完成模型的训练工作。并且,“基本上半年迭代一次主要的声学模型。”

“这些东西看起来是基础设施,但一旦到定制的时候,所展现出的效率、领先的训练速度、定制化的能力是不容小视的。” 鄢志杰说,“算法+数据+计算的循环,就能够打造任意一个垂直领域、极高的语音识别准确率的一个标杆。”

阿里云的云计算能力及其在技术上下的硬功夫,如算法优化,是智慧法庭一夜之间冒出来的基础的支撑。
 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里巴巴、腾讯等,作为阿里云腾讯云百度云金山云重要的金牌合作伙伴,专注于为企业用户提供云计算及云计算的解决方案。