fbpx

淺談 DeepL:懂得「說人話」的機器翻譯

淺談 DeepL:懂得「說人話」的機器翻譯
                                       

談到線上翻譯工具,一般人只會想到 Google,但是在機器翻譯(Machine translation)領域,近年來年出現了一匹黑馬—— 2017 年上線 DeepL,迄今已有超過 10 億人在使用,樂天、西門子、富士通、Nokia、BestBuy 都是他們的客戶。這些企業之所以選擇 DeepL,關鍵在於其翻譯品質要比他的競爭對手更流暢、細緻。

圖片來源/Photo by Skylar Kang from Pexels

根據 DeepL 與外部專業譯者合作的盲測研究,他們拿對手的翻譯系統與自己做比較,在不同領域的文本中,DeepL 在英語、德語、法語、西班牙語的翻譯表現,DeepL 評分都遠超過 Google、亞馬遜、微軟的翻譯系統。

截圖/DeepL 官網

 

除了上述語言,DeepL 中文表現也很優秀,我們以原文小說《魔戒》開場詩來舉例:

Three rings for the Eleven-kings under the sky,

Seven for the Dwarf-lords in their halls of stone,

Nine for Mortal Men doomed to die,

One for the Dark Lord on his dark throne,

In the Land of Mordor, where the shadows lie.

One Ring to rule them all, One Ring to find them,

One Ring to bring them all, and in the darkness bind them.

In the Land of Mordor, where the shadows lie.

聯經的中譯版本(1988):

三枚戒指給天底下的小精靈國君,

七枚戒指給石廳中的小矮人之王,

九枚戒指給注定免不了一死的人,

一枚戒指給黑暗中的黑大王──

那麼多地方由一片魔影籠罩著。

這枚戒指發現了它們,並且掌管著它們,

這枚戒指帶回了它們,並將它們禁錮黑暗之中。

是呀!那麼多地方由一片魔影籠罩著…

Google 翻譯:

天下十一王三環,

七個為矮人領主在他們的石頭大廳裡,

九個注定要死的凡人,

一個為黑暗王座上的黑魔王,

在魔多之地,陰影所在的地方。

一環統治他們,一環找到他們,

一枚戒指將他們全部帶來,並在黑暗中將他們捆綁在一起。

在魔多之地,陰影所在的地方。

DeepL 翻譯:

三枚戒指給天空下的十一位國王。

七枚為矮人領主在他們的石頭大廳。

九枚給注定要死亡的凡人。

一枚給黑暗王在他的黑暗王座上。

在陰影籠罩的魔多之地。

一枚魔戒統治他們所有人,一枚魔戒找到他們。

一枚魔戒將他們全部帶來,在黑暗中束縛他們。

在陰影籠罩的魔多之地。

不難看出,聯經版本是三者中句子最通順的,再者是 DeepL,Google 墊底。這不代表 Google 翻譯不好,除了第一句語意不知所云,其他部分都接近原文,但 DeepL 明顯更勝一籌,上下文環環相扣,如果不說,恐怕沒人會懷疑這是機翻。不過 DeepL 也不是樣樣精通,比如敘事類文體,翻譯表現與 Google 同樣表現不佳,機翻痕跡還是很明顯。

2017 年上線的 DeepL,實際上卻不如外表那般年輕。DeepL 的前身為 Linguee,是一家 2009 年於德國成立的線上字典公司。2014 年,第一篇關於神經機器翻譯(NMT)的論文誕生,深度學習(Deep learning)開始有了飛躍性的進展,Linguee 抓住這個機會,2016 年組成一支團隊並著手開發 DeepL。隔年,DeepL 翻譯服務正式上線。

DeepL 上線初期,大部分對手仍在使用表現不盡理想的的統計機器翻譯(SMT)系統,因此 DeepL 很快就建立起良好的口碑。 2006 年問世的 Google 翻譯,直到 2016 年才從 SMT 切換至 NMT,但人們對它第一印象仍然揮之不去。如果你是 Google 翻譯的早期使用者,應該對它充滿「機械感」的翻譯表現有印象。儘管如此,Google 翻譯目前支援 100 多種語言,數量要高於 DeepL 的 26 種,在語言種類方面,Google 仍佔有絕對的優勢。

現在的機器翻譯廠商都在使用 NMT 來訓練 AI,為何 DeepL 翻出的句子就是比較通順?DeepL 部落格有篇文章專門解答此問題,內文提到他們使用改良的神經網絡架構、開發專門的爬蟲、運用其他領域的技術、重視高效地使用網絡數值……看完恐怕只有一個感想:他們什麼都說了,又好像什麼都沒說。根據《Slator》2021 年 9 月一則報導,內文指出,DeepL 向來不太願意公佈他們的「秘方」,這間公司也鮮少發表論文或者參加技術性會議。

DeepL 翻譯服務是免費的,且不含廣告。目前支援 Windows、macOS、iOS 與網頁版本。當 DeepL 程式在背景執行時,可以透過快捷鍵(比如 Ctrl+Q)翻譯反白文本。目前可翻譯 26 種語言,但僅有簡體中文,沒有繁體選項。此外,免費版還提供手動輸入術語表,以及 .doxc、.pptx、.pfd 檔案的文件翻譯。

如果是企業或專業人士,可以選擇付費版的 DeepL Pro,好處如翻譯字數無限制、數據加密等。雖然訂閱服務暫未進入臺灣,但有免費版可使用。有興趣的讀者,可以前往 DeepL 網站好好體驗一遍。

▼ 免費版有 5,000 字限制,超過字數就必須分段翻譯。

 

機器翻譯是一項需要不斷累積的技術,AI 要經過長時間的訓練才能換來良好的翻譯品質,背後也代表公司必須挹注龐大的資源。小公司要挑戰銀彈充足又人才濟濟的科技巨頭,並非只存在於童話故事,DeepL 的故事不僅勵志,也應證了把握機會是多麼重要。如果 DeepL 再晚個一兩年上線,情況或許又會有所不同。

新奇產品

叫我小高就好了。聯絡方式:8bitgaoooo@gmail.com

More in 新奇產品

Oura 與 Gucci 跨界合作 推出售價 950 美元穿戴式戒指

高伯任2022-05-27

小米手環7 6 月 1 日台灣上市!

Candice Chao2022-05-27

戴森秘密研發機器人原型 預計 2030 年量產

高伯任2022-05-27

「元夢家kidznft」 亞洲第一個為孩子成立的 NFT 藝術創作平台

Candice Chao2022-05-26

亞馬遜開放臺灣用戶直購 Echo 系列智慧音箱

高伯任2022-05-25

Apple 推出新款 Apple Watch 彩虹版錶帶與彩虹版錶面

Candice Chao2022-05-24