Categories
熱門新聞

人工智能翻譯:只能輔助無法取代人類的原因 – BBC News 中文


谷歌翻譯圖片版權
Google

谷歌、微軟、有道、訊飛……翻譯軟件越來越普及,質量越來越高,但要取代人類在翻譯界的地位?

機器在翻譯領域的應用越來越廣已經沒有疑問,可以看見機器在部分領域部分取代人工翻譯正在發生,在一些高等學府的現代語言學位課程中也有了一席之地。

但準確地說,在翻譯界機器仍處於輔助地位,還是工具,電腦輔助翻譯(CAT)工具。

迄今為止CAT最大的貢獻是讓人類擺脫了簡單重複的勞務;它主要還是扮演輔助角色,因為人類的語言系統既恢弘又精密,溫度和色調的豐富多彩及千變萬化,機器一時半會兒還無法完全掌握。

圖片版權
Getty Images

Image caption

谷歌無線翻譯耳機被戲稱為“翻譯神器”

可以用美國初創公司Waverly Labs首席執行官安德魯·奧喬亞(Andrew Ochoa)的兩句話為例。這家公司生產翻譯耳機。

“It has taken decades of research to create a framework of algorithms designed to recognise patterns in the same way as the human brain – a neural network,” says Andrew Ochoa, chief executive of US start-up Waverly Labs, which produces translation earpieces.

“Combining that with speech recognition technology has allowed us to make a huge leap forward in terms of accuracy.”

美國初創公司Waverly Labs首席執行官安德魯·奧喬亞(Andrew Ochoa)說:經過數十年的研究,創建了一種算法框架,旨在以與人腦相同的方式識別模式 – 神經網絡。

將其與語音識別技術相結合,使我們在準確性方面取得了巨大的飛躍。

雖然沒有大錯,但讀來總感覺哪裡不太順,而且跟原意還是有較明顯的差異。

創建一種能夠像人腦一樣識別模式的算法框架 – 神經網絡,是在數十年研究的基礎上完成的。

將它(神經網絡)與語音識別技術將結合,使我們在 準確性方面取得巨大飛躍。

這個修飾機器翻譯的過程可能容易也可能痛苦。西班牙英-西翻譯納瓦羅·戈薩爾維茲就認為CAT工具與其說是在幫忙不如說是扼制創造性。

他說,機器給你一份半成品,你得花加倍的力氣和時間去核對、糾正、修飾,還不如自己從頭做起更快更容易。

尤其是涉及到情感等主觀色彩較濃或者語氣微妙的情況,譯文詞不達意可能算是好的,更有可能出現令人啼笑皆非的荒唐結果。

圖片版權
Microsoft

Image caption

微軟研究(Microsoft Research)的語音和語言技術研究員黃學東表示,機器翻譯靠的是學習語言的規則

“里程碑”

2017年,微軟亞洲研究院與雷德蒙研究院研發的機器翻譯系統的漢 – 英新聞報導翻譯質量和準確率達到人類專業翻譯水平。

這個newstest2017新聞報導測試集在國際權威評測大賽WMT17大會上發布。當時媒體稱之為人工智能(AI)里程碑。

但這並不意味著翻譯機器可以替代人類,更遑論全面替代。

這個話題當時在中文專業社交網站“知乎”上引起討論。

用戶“小號是留住最真的”預測,3-5年內,非文學類(專業、應用類)筆譯將被取代90%,會展等低端陪同口譯至少70%將被口譯設備和app取代。中高端(會議、同傳口譯)5-7年內將被取代50%以上。文學類還看不到被取代的可能性,

即便是不涉及較多主觀情感色彩的專業翻譯,比如法庭口譯,即使是同一語系的英-法互譯,谷歌翻譯目前仍有較大改善空間。

圖片版權
Google

Image caption

愛之切切,怎一個LO​​VE了得?

怎一個LO​​VE了得?

看上面截圖,中文“愛之切切”,怎一個LO​​VE了得?

“山川異域”,日本救援武漢抗擊新冠肺炎的物資包裝上用了這個詩句,它難道不是oceans apart 的意思?至少不應該是異域風情之意吧?

“風月同天”翻譯成相同的風和月,意思模棱兩可,含糊其辭。當然,畢竟還是機器,人工智能,還沒把漢語詩詞學精學透。

圖片版權
Wordbank

Image caption

英國翻譯公司 Wordbank 內容業務負責人庫珀(Zoey Cooper)認為現階段機器翻譯只能是人類翻譯的輔助

機器就是機器

薩曼莎·蘭利(Samantha Langley)曾經當過律師,現在是法庭認證批准的法-英法律翻譯。她的親身體驗是“谷歌翻譯可能出現重大錯誤,尤其是涉及一詞多義的情況,而這在法律和工程等專業領域也很常見”。

翻譯機器和軟件無疑在某些領域很有用,比如使用說明、問卷調查、市場訊息和比賽數據等,但生硬和不准確仍是在更廣泛的領域使用機器翻譯的主要障礙。

消費市場隨身譯工具種類也越來越多。最近很火的一款是WLE翻譯耳機,跟智能手機軟件配套使用。翻譯耳機會把外語語音翻譯成用戶選擇的語言。

說是即時同傳,但也有幾秒鐘的延後,如果網速慢則時間差更大。

更主要的是, 人類的語言交流,字詞句只是最基本的元件,還有大量看不見的要素,語氣語調、修辭技巧等等,還有方言、俚語、成語和習慣用法等變量。

跨國市場營銷和翻譯公司Wordbank(字庫)的品牌及內容總監佐伊·庫珀(Zoey Cooper)很清楚機器翻譯的短板。

她對BBBC記者傑西卡·伯溫(Jessica Bown)說:“要想跟讀者建立聯繫,就需要人來翻譯,那樣才可能做到自然順暢,準確捕捉到話裡話外的情緒,而這通常需要徹底改變句子的結構或語序。”

圖片版權
Getty Images

Image caption

機器翻譯技術雖有改進,但仍然會出現錯誤

如此看來,在最近的將來,機器仍舊只能扮演輔助角色。

勞工市場看來也有同感。

英國招聘網站Reed的廣告中有15%的職位要求至少掌握一門外語;美國商會外語教學部的研究發現,75%的企業需要員工掌握不止一種語言。

在翻譯軟件和手機翻譯app越來越普及的中國,學英語仍被許多家長認為是必須從娃娃抓起的大事。

世界上有5600多種語言,英語是最通用的,即便是所有語言跟英語互譯,機器取代人類也需要相當長時間,需要做很多準備,包括數據庫和神經網絡(算法)的設計。

.