其實不只簡體中文、繁體中文的語法溝通,他流露,日文、韓文在機械翻譯上也可算是語法溝通,用統一套系統翻譯
聯合報系資料照片 google台灣董事總經理簡立峰說,google翻譯比之前好用太多了!就算有人惡作劇,決心在「提出點竄建議」欄位寫下錯的翻譯,也不會影響系統的運作翻譯
結合報系資料照片"> 數年前,google採用遞歸神經網絡(recurrentneural networks)將句子視為一個單元進行翻譯,以後的片語式機械翻譯體式格局(pbmt),則是將句子切割成零丁的字和詞組做自力翻譯翻譯 他認為,雖然簡體中文、繁體中文有些溝通的字詞有著分歧的意義,或不異的字已衍生出新的意義,但因簡體、繁體中文語法溝通,在機械翻譯上仍採用一套系統,可視為專著名詞,透過進修豎立資料庫來校正。翻譯
注重 (attention)功能是為了每步都產出准確的詞,解碼器將針對編碼中文向量裡最相關的英文單詞權重分布(weighted distribution)進行解碼。
曩昔,為翻譯肆意兩種說話,google需要建構多個分歧的翻譯系統,運算成本相當可觀。相較於曩昔的片語機械進修(pbmt),神經機械翻譯(nmt)僅需要較少的系統架構設計。剛開始推出神經機器翻譯時,這兩種翻譯體式格局的精準度八兩半斤。
在讀取完全句子後,解碼器(decoder)就會起頭運作,一次產生一個英語句子中的一個詞。
google神經機械翻譯(gnmt)將中詞句子翻譯成英詞句子的過程,透過編碼器 (encoder),起首,gnmt將中詞句子的每個單詞進行向量(vector)編碼,而每一個向量將顯示出目前為止單詞被讀取到的所有意義。
簡立峰注釋,google翻譯有進修及資料庫的功能,赓續積累經驗,毛病也是一種經驗,除非幾近所的人都在「點竄建議」欄寫下一模一樣的毛病,才會積非成是,但事實上這類環境其實不可能發生。
他指出,機械進修是很主要的議題,大師在評論辯論google翻譯的學習功能之際,也會聯想到人工電腦alphago打敗真人世界棋王。目前也有人提出讓alphago打alphago,進修能力可以更快的說法,就像是金庸小說「西嶽論劍」裡全真派的周伯通,用本身的左手和右手對打,使出的「左右互搏」翻譯
文章出自: https://udn.com/news/story/6811/2440774有關翻譯的問題歡迎諮詢華頓翻譯社