2月3日消息,由最 高人民法院司改辦和中國(guó)中文信息學(xué)會(huì)指導(dǎo)的中國(guó)法律智能技術(shù)評(píng)測(cè)(CAIL 2022)于日前公布比賽結(jié)果,阿里巴巴達(dá)摩院在八項(xiàng)任務(wù)中獲得兩個(gè)冠軍,是獲得多項(xiàng)第 一的參賽團(tuán)隊(duì)。據(jù)介紹,此次參賽使用的預(yù)訓(xùn)練大模型底座通義AliceMind-structBERT已在魔搭社區(qū)開放,該模型是法律AI領(lǐng)域首個(gè)億級(jí)數(shù)據(jù)規(guī)模的大模型。

  近年來,用AI輔助司法工作者提升案件處理的效率和公正性,逐漸成為法律領(lǐng)域的趨勢(shì)。作為國(guó)內(nèi)最權(quán) 威的法律AI競(jìng)賽,CAIL已連續(xù)舉辦5屆比賽。 據(jù)介紹,CAIL 2022設(shè)置了司法考試、事件檢測(cè)、文書校對(duì)、類案檢索、涉法輿情摘要、論辯理解、信息抽取、可解釋類案匹配八項(xiàng)任務(wù),共吸引2053支高校、企業(yè)和組織隊(duì)伍參賽。最終,達(dá)摩院在眾多參賽隊(duì)伍中脫穎而出,獲得文書校對(duì)和可解釋類案匹配兩項(xiàng)任務(wù)的最 高分。

圖片1.jpg

文書校對(duì)任務(wù)成績(jī)榜單

  文書校對(duì)主要用于輔助司法人員檢出并糾正法律文書中存在的錯(cuò)誤,例如錯(cuò)別字、冗余、缺失、亂序等類型錯(cuò)誤。此次比賽,達(dá)摩院采用了序列到編輯和序列到序列兩種主流的模型結(jié)構(gòu),并且采用編輯級(jí)別投票的方式對(duì)二者進(jìn)行集成,其可以嘗試將錯(cuò)誤的句子翻譯成正確的句子,同時(shí)對(duì)錯(cuò)誤位置進(jìn)行插入、修改、刪除等編輯動(dòng)作。此外,為解決訓(xùn)練數(shù)據(jù)不足的問題,達(dá)摩院還采用數(shù)據(jù)增強(qiáng)的方法生成了大量的訓(xùn)練語料,有效提升模型的糾錯(cuò)能力,最終該模型以81.759分的成績(jī)獲得第 一。

圖片2.jpg

可解釋類案匹配任務(wù)成績(jī)榜單

  可解釋類案匹配可以為待決案件的裁判提供參考和依據(jù)。參賽隊(duì)伍需要針對(duì)系統(tǒng)給定的兩個(gè)案件信息,來判斷兩個(gè)案件是“匹配”、“部分匹配”還是“不匹配”關(guān)系。達(dá)摩院基于法律特征句,構(gòu)建了句-段-案件的類案匹配體系,最終判斷出案件匹配程度,而其中的句子和段落則可成為類案匹配的依據(jù),從而達(dá)到模型的可解釋性。并且對(duì)案件匹配任務(wù)進(jìn)行了細(xì)粒度的拆解,針對(duì)不同匹配性質(zhì)選用不同文本輸入,有效提升模型匹配的魯棒性。最終總成績(jī)?yōu)?.801,位列第 一位。

  目前,達(dá)摩院在法律AI領(lǐng)域已發(fā)表數(shù)十篇國(guó)際頂會(huì)論文,團(tuán)隊(duì)輔助研發(fā)的AI法官助理“小智”已在浙江省高院、黑龍江高院等法院上線應(yīng)用,可將簡(jiǎn)單案件庭審效率提升50%以上,已輔助審理案件超10000件。

責(zé)任編輯:whybine