國際頂級翻譯比賽 搜狗機器翻譯獲世界冠軍!
來源:未知?? 日期:2017-08-08 09:33
核心提示: 2017年7月31日,王小川的一封內部信讓平靜了許久的資本市場熱鬧起來,同時也讓自家的人工智能再次火了起來,尤其是機器翻譯技術。王小川內部信中提到,搜狗機器翻譯在
齊魯晚報08月07日訊:2017年7月31日,王小川的一封內部信讓平靜了許久的資本市場熱鬧起來,同時也讓自家的人工智能再次火了起來,尤其是機器翻譯技術。王小川內部信中提到,搜狗機器翻譯在國際頂級機器翻譯比賽WMT (Workshop on Machine Translation)中譯英項目中榮獲世界冠軍,其中八項機器評價指標七項第一,并獲得主要機器指標BLEU(Bilingual Evaluation Understudy)第一名。
據了解,WMT比賽是由來自歐洲和美國的高校、研究機構(例如Charles University、University of Edinburgh、FBK、MSR等)的研究人員聯合舉辦,從2006年開始至今已舉辦12屆,是業界公認的國際頂級機器翻譯比賽之一,今年,參賽任務包括英語、捷克語、德語等七個語種的14個翻譯方向,參賽隊伍也均為約翰霍普金斯大學、愛丁堡大學、俄勒岡州立大學、美國空軍研究實驗室等國內外業界領先組織機構。
此次搜狗機器翻譯獲得多個項目第一的中譯英系統是WMT今年新增加的翻譯方向,搜狗采用深度循環神經網絡編碼解碼框架技術(Deep Recurrent Neural Network Encoder-Decoder)作為主要技術,使用完全端到端的學習方式,
相對于傳統的統計機器翻譯,深度神經網絡翻譯技術優勢巨大,不但能幫助整個翻譯決策的過程技術連續且具有全局性,還能讓翻譯出的句子更流利。尤其是在翻譯調序方面和復雜語法結構翻譯方面,看到的歷史信息較長和分布式標示詞句的特質,使得深度神經網絡翻譯技術可以使用全部的源端文本和部分目標端上下文信息,也能更好的挖掘詞、短語的語義信息。此外,搜狗在比賽系統中還使用多個NMT模型集成技術,針對生成的N-best結果,會引入更多模型(例如語言模型)等特征對模型生成的多個候選結果進行重排序,選出更好的后續結果,充分體現出其在人工智能實用化的領域卓絕的技術。
此番獲得冠軍是搜狗人工智能實力的見證,比賽中,搜狗機器翻譯技術以達到27.2/26.4(BLEU/BLEU-cased)的高分成績領先其他選手。
資料顯示,搜狗機器翻譯團隊成立于2016年,是搜狗知音引擎的重要技術方向,成立之初,基于知音引擎團隊在語音技術方面的積累,搜狗機器翻譯團隊僅用半年時間,就自研完成了獨創的神經網絡機器翻譯技術,并在2017年5月的wmt國際評測中獲得中英翻譯的冠軍。
搜狗機器翻譯團隊表示,搜狗發展AI一直堅持的都是“實用”這一衡量標準,此次參賽使用的神經網絡機器翻譯技術除了運用在會議中的搜狗同傳產品外,像是搜狗輸入法上線的中譯英語音翻譯和文本翻譯功能中也有體現,未來,以搜狗機器翻譯為代表的各項人工智能技術也相繼應用到產品中去,不斷深耕更多更實用的技術場景。
?