國際頂級(jí)翻譯比賽 搜狗機(jī)器翻譯獲世界冠軍!
齊魯晚報(bào)08月07日訊:2017年7月31日,王小川的一封內(nèi)部信讓平靜了許久的資本市場(chǎng)熱鬧起來,同時(shí)也讓自家的人工智能再次火了起來,尤其是機(jī)器翻譯技術(shù)。王小川內(nèi)部信中提到,搜狗機(jī)器翻譯在國際頂級(jí)機(jī)器翻譯比賽WMT (Workshop on Machine Translation)中譯英項(xiàng)目中榮獲世界冠軍,其中八項(xiàng)機(jī)器評(píng)價(jià)指標(biāo)七項(xiàng)第一,并獲得主要機(jī)器指標(biāo)BLEU(Bilingual Evaluation Understudy)第一名。
據(jù)了解,WMT比賽是由來自歐洲和美國的高校、研究機(jī)構(gòu)(例如Charles University、University of Edinburgh、FBK、MSR等)的研究人員聯(lián)合舉辦,從2006年開始至今已舉辦12屆,是業(yè)界公認(rèn)的國際頂級(jí)機(jī)器翻譯比賽之一,今年,參賽任務(wù)包括英語、捷克語、德語等七個(gè)語種的14個(gè)翻譯方向,參賽隊(duì)伍也均為約翰霍普金斯大學(xué)、愛丁堡大學(xué)、俄勒岡州立大學(xué)、美國空軍研究實(shí)驗(yàn)室等國內(nèi)外業(yè)界領(lǐng)先組織機(jī)構(gòu)。
此次搜狗機(jī)器翻譯獲得多個(gè)項(xiàng)目第一的中譯英系統(tǒng)是WMT今年新增加的翻譯方向,搜狗采用深度循環(huán)神經(jīng)網(wǎng)絡(luò)編碼解碼框架技術(shù)(Deep Recurrent Neural Network Encoder-Decoder)作為主要技術(shù),使用完全端到端的學(xué)習(xí)方式,
相對(duì)于傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯,深度神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)優(yōu)勢(shì)巨大,不但能幫助整個(gè)翻譯決策的過程技術(shù)連續(xù)且具有全局性,還能讓翻譯出的句子更流利。尤其是在翻譯調(diào)序方面和復(fù)雜語法結(jié)構(gòu)翻譯方面,看到的歷史信息較長和分布式標(biāo)示詞句的特質(zhì),使得深度神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)可以使用全部的源端文本和部分目標(biāo)端上下文信息,也能更好的挖掘詞、短語的語義信息。此外,搜狗在比賽系統(tǒng)中還使用多個(gè)NMT模型集成技術(shù),針對(duì)生成的N-best結(jié)果,會(huì)引入更多模型(例如語言模型)等特征對(duì)模型生成的多個(gè)候選結(jié)果進(jìn)行重排序,選出更好的后續(xù)結(jié)果,充分體現(xiàn)出其在人工智能實(shí)用化的領(lǐng)域卓絕的技術(shù)。
此番獲得冠軍是搜狗人工智能實(shí)力的見證,比賽中,搜狗機(jī)器翻譯技術(shù)以達(dá)到27.2/26.4(BLEU/BLEU-cased)的高分成績(jī)領(lǐng)先其他選手。
資料顯示,搜狗機(jī)器翻譯團(tuán)隊(duì)成立于2016年,是搜狗知音引擎的重要技術(shù)方向,成立之初,基于知音引擎團(tuán)隊(duì)在語音技術(shù)方面的積累,搜狗機(jī)器翻譯團(tuán)隊(duì)僅用半年時(shí)間,就自研完成了獨(dú)創(chuàng)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),并在2017年5月的wmt國際評(píng)測(cè)中獲得中英翻譯的冠軍。
搜狗機(jī)器翻譯團(tuán)隊(duì)表示,搜狗發(fā)展AI一直堅(jiān)持的都是“實(shí)用”這一衡量標(biāo)準(zhǔn),此次參賽使用的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)除了運(yùn)用在會(huì)議中的搜狗同傳產(chǎn)品外,像是搜狗輸入法上線的中譯英語音翻譯和文本翻譯功能中也有體現(xiàn),未來,以搜狗機(jī)器翻譯為代表的各項(xiàng)人工智能技術(shù)也相繼應(yīng)用到產(chǎn)品中去,不斷深耕更多更實(shí)用的技術(shù)場(chǎng)景。