“土
话”
难懂!
一方水土养一方人
一方人说一种话
上衣叫挂子
口吃叫夹瑟子
吐口水叫吐闲水
男生叫儿娃子
女生叫俩娃儿……
好友发来一段语音,你手头正忙,习惯性地长按选择语音转文字,不出所料弹出一串不知所云的字符。方言识别一直是各大语音识别系统中的一处短板,作为地方风土人文缩影的方言也给法院庭审和笔录工作增加了难度。
宜城市辖11个乡镇(街道),源远流长的方言更有四五种之多,夸张一句“十里不同音”也不为过。面对当事人又快又急的方言,尽管书记员全神贯注,往往也是手忙脚乱,疲于应对。对上当事人说方言,即使有AI加持的庭审语音识别系统也“不堪大用”。有没有什么办法,能让语音识别系统准确识别出方言,发挥出更多效用呢?宜城法院深化数字法院赋能,自有妙计!
1
打“嘴”仗,二十多个书记员齐上阵
宜城方言介于北方河南话与南方武汉话之间,境内汉水两岸、东西两山,口音“土话”也各有不同。为了让“智慧法院”的庭审语音识别系统准确识别出宜城方言,宜城法院自2024年8月以来,联合北京华宇及湖北小点公司对语音系统进行专项升级,集合宜城本地出生的二十多个书记员,操着本地不同的口音,对剪辑为30秒一段、总时长200小时的庭审方言语音进行统一识别和标注。
“客气包”=膝盖,“疙夹窝”=腋窝,“上富”≠上树而=上诉,“错儿的”=昨天,还有,“脑阔”这个方言应该翻译为“脑袋”还是“头部”?庭审中的每一句话每一个字,都需要书记员们认真识别比对,统一翻译,才能保证方言识别达到应有的准确率。经过4个多月的努力,200小时的音频已训练完成150小时,新系统在12月6日正式投入使用。
2
测效果,方言识别率97.3%!
“现在开庭。”随着一声清脆的法槌声,一起民间借贷纠纷案件在宜城市人民法院三号审判庭开庭审理。审判长话音未落,显示屏上立刻同步出现汉字:“审判长:现在开庭。”审判庭内,当事人操着一口方言各执一词,显示屏上却按着普通话文字同步记录着法官和诉讼参与人说的每句话。晦涩难懂的方言被转化为标准规范的普通话表述,书记员只需对庭审记录界面进行辅助记录,便可确保庭审记录的准确无误。
经过12次庭审实战,新的语音识别系统转化准确率达到97.3%以上,已经具备实用价值,庭审记录效果得到飞跃性提升,不论是当事人磕磕巴巴的方言,还是代理人的滔滔雄辩,语录录入系统都可轻松应对。
3
多场景,便携识别让审执更高效
在审判实践中普遍存在着这样一个问题:在庭外接触当事人时,没有条件做笔录,或者虽有条件,但当事人不配合做笔录,以致法院干警路跑了、话说了、事做了,但就是没有笔录。办案缺记录,卷宗缺资料,问责缺依据。随着方言语音录入系统的训练成熟,宜城法院提出更高要求:在移动端使用,让法院干警办案随带,便捷记录审执活动,保障规范办案。北京华宇及湖北小点公司再次组织技术力量,开发出多平台、多场景使用的方言语音识别系统APP,直接在平板电脑上安装使用。该技术设备推广后,法院干警无论是在外组织调解,还是外出执行,只要拿上一部平板电脑打开方言语音识别系统,即可实现即时完整记录、当场电子签名,并即时将现场笔录同步回传至法院系统内。后续只需对文字内容稍加处理,便可还原勘验、询问、通话、调解、执行等各种场景下的现场语音及文字记录,保障办案“留证留痕”,促进司法公开公正。
一台pad
即可使用!
据了解,宜城法院是襄阳首家升级使用庭审方言语音识别系统的法院,该系统不仅支持普通话输入,而且可以精准识别当地方言,让书记员从繁重的文字输入压力中解放出来。它的成功使用将进一步提高审执效率,也标志着宜城法院开启了智能语音识别新时代。
来源:宜城法院
审核: 王洪
终审:周俊庆
热门跟贴