ka2012 |
2019-08-26 15:46 |
人工智能延伸科學(xué)交流觸角
近日,一款看起來(lái)挺有文化的寫(xiě)稿機(jī)器人上線了。它叫小柯,由中國(guó)科學(xué)報(bào)社和北京大學(xué)科研團(tuán)隊(duì)共同研發(fā)。 0+3_CS++r 3g79pw2w= 小柯寫(xiě)的不是普通的稿子,而是中文科學(xué)新聞。據(jù)介紹,運(yùn)用自然語(yǔ)言處理技術(shù),小柯以英文論文摘要為基礎(chǔ),能夠快速寫(xiě)出中文科學(xué)新聞底稿,然后由專(zhuān)業(yè)人士和報(bào)社的編輯進(jìn)行把關(guān)和信息完善,幫助科學(xué)家以中文方式快速獲取全球高水平英文論文中的最新科研進(jìn)展。 4e`GMtp
-ElK=q 目前小柯的作品已經(jīng)上線。人工智能的觸角,也在伸向各個(gè)領(lǐng)域。 {^8->V 78~;j1^6u 小柯:一個(gè)盡職的摘要翻譯轉(zhuǎn)寫(xiě)者 W _b!FQ] \:mZ)f3K= 記者發(fā)現(xiàn),7月5日,小柯機(jī)器人發(fā)出第一篇稿子,截至8月22日記者統(tǒng)計(jì)時(shí),小柯機(jī)器人共發(fā)稿415篇。初期更新時(shí)間距論文發(fā)表時(shí)間間隔一個(gè)月左右,現(xiàn)在可以做到當(dāng)天或隔天更新,每天更新幾篇到二十幾篇不等。所選論文來(lái)自生命科學(xué)等領(lǐng)域,涉及《自然》《細(xì)胞》《新英格蘭醫(yī)學(xué)雜志》等期刊。 pZxuV(QP` 'v^Zterr 記者對(duì)照分析了小柯作品《單細(xì)胞測(cè)序揭示冠狀動(dòng)脈疾病保護(hù)機(jī)制》及其英文原文。新聞中,小柯先對(duì)論文主題、研究單位以及發(fā)表期刊進(jìn)行簡(jiǎn)單介紹,后接英文原文摘要的翻譯,大致反映原文內(nèi)容;翻譯時(shí)會(huì)對(duì)原文進(jìn)行適當(dāng)?shù)恼Z(yǔ)句簡(jiǎn)化,同時(shí)在對(duì)專(zhuān)業(yè)詞語(yǔ)的翻譯上也使用了如“血管平滑肌細(xì)胞”“保護(hù)性纖維帽”等專(zhuān)業(yè)表述。 ob.Br:x |7CFm 不過(guò),這也不全是小柯的功勞,因?yàn)楦寮l(fā)出前,還有人工審校這一步驟。北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬(wàn)小軍團(tuán)隊(duì)負(fù)責(zé)小柯的系統(tǒng)總體設(shè)計(jì)與聯(lián)合技術(shù)攻關(guān)。他告訴科技日?qǐng)?bào)記者,目前機(jī)器翻譯系統(tǒng)的性能很大程度上依賴(lài)于其所使用的訓(xùn)練數(shù)據(jù),即平行語(yǔ)料。目前的平行語(yǔ)料多為新聞?wù)Z料,因此訓(xùn)練得到的機(jī)器翻譯模型對(duì)于日常新聞的翻譯效果較好。但學(xué)術(shù)文獻(xiàn)(比如生物學(xué)術(shù)論文)與日常新聞在用詞造句等方面都有較大差別,機(jī)器翻譯系統(tǒng)對(duì)于學(xué)術(shù)文獻(xiàn)翻譯的效果并不理想。 =# /BCL7 6
| |