一年內憑空冒出6家智能翻譯機 你覺得這事靠譜嗎?通信
?據(jù)統(tǒng)計發(fā)現(xiàn),從2016年5月到2017年6月這一年之間,同時有6間企業(yè)推出了類似形態(tài)的翻譯機/翻譯耳機,既有我們熟悉的國內語音巨頭科大訊飛,也有來自澳大利亞、日本、荷蘭的創(chuàng)業(yè)企業(yè)。
前不久,智能硬件圈的微博被一則新聞小小地刷了個屏――IBM Watson聯(lián)合澳洲創(chuàng)企Lingmo推出了一款能夠進行“機器同聲傳譯”的耳機Translate One2One。這款耳機不僅支持英語、中文、日語、法語、意大利語、德語、葡萄牙語、以及西班牙語的同聲傳譯(3-5秒內),而且不需要外接藍牙或是WiFi,售價179美元,官網顯示7月將發(fā)貨。
筆者在微博上被人@了一大圈,大家提問題中心思想只有兩個――“這事靠譜嗎?”,以及“靠譜我就買了。”
據(jù)統(tǒng)計發(fā)現(xiàn),從2016年5月到2017年6月這一年之間,同時有6間企業(yè)推出了類似形態(tài)的翻譯機/翻譯耳機,既有我們熟悉的國內語音巨頭科大訊飛,也有來自澳大利亞、日本、荷蘭的創(chuàng)業(yè)企業(yè)。在這些翻譯機硬件,則有更多如IBM Watson、谷歌、百度……以及其他創(chuàng)業(yè)公司如彩云AI等提供翻譯技術。
一、翻譯耳機
1、澳洲創(chuàng)企Lingmo――Translate One2One
既然文章緣起是這部翻譯耳機,那么我們就先來講講IBM Watson+澳洲創(chuàng)企Lingmo的組合。
機器翻譯的步驟大概可以如下劃分:語音識別-自然語意理解-翻譯-語音合成(也有劃分為:語音識別-機器翻譯-語音合成)。Translate One2One中使用了IBM Watson的自然語意理解(NLU, Natural Language Understand)翻譯的API,同時結合了Lingmo自己的硬件技術與機器學習應用。
而這部耳機的特性,正如上文介紹,不僅支持英語、中文、日語、法語、意大利語、德語、葡萄牙語、以及西班牙語的同聲傳譯(3-5秒內),而且不需要外接藍牙或是WiFi,售價179美元,官網顯示7月將發(fā)貨。
IBM Watson幾乎可以算得上是自然語言處理(NLP)老祖式的人物了。早在2011年,Watson就被搬上了美國智力問答節(jié)目《危險邊緣》。這個問答節(jié)目與傳統(tǒng)游戲設置不同,選手面對的是答案,需要給出與這個答案相對應的問題,參賽者需具備歷史、文學、政治、科學和通俗文化等知識。比如:當給出的線索是“美國之父,砍倒櫻桃樹”是,選手可以這樣回應:“誰是喬治?華盛頓?”
此外,參賽者有時還需要具備解析隱晦含義、反諷與謎語等技能,才能夠得出答案。例如,在某次節(jié)目中,參賽選手抽到了一個名為“Chicks Dig Me”的類別,字面意義理解是“小雞喜歡我”,但其實真正含義是“妹子喜歡我”。
對Watson來說,參與這種智力競賽節(jié)目的難題并不是知識量的儲備――畢竟Watson存儲了4TB的數(shù)據(jù),遠超人類大腦。真正困難的是讓計算機學會解析人類的語言、識別人類語言中微妙的含義、分辨諷刺口吻、謎語、構詞斷句、詩篇線索等等這些邏輯和線索。然后才是對題目進行分解,快速搜索自己的內存資料,尋找到最佳答案。
至于這次比賽的結果,大家都知道了――Watson打敗兩位人類冠軍,獲得第一名。
6年過去了,Watson不怎么上電視答題了,但它從未停止對自然語言處理(及其他人工智能技術)的研發(fā)。如今的Watson不僅能翻譯各種語言,還能從人們的語言文本中進行情緒分析、人格特質判別、寫作風格歸類、社會傾向劃分。
2、紐約創(chuàng)企Waverley Lab――The Pilot Translator
在描寫Translate One2One的文章中,常常提到了另外一個類似的翻譯耳機――The Pilot Translator(也被簡稱為Pilot耳機)。這款翻譯耳機由紐約創(chuàng)企Waverley Lab在2016年5月推出,最初在Indiegogo眾籌平臺上獲得了1萬9千人支持,籌得450萬美元。如今總共預售了2萬5千套,共籌集了500萬美元,第一批產品預計2017年秋季就會發(fā)貨,公司還參加了今年3年在巴塞羅那舉辦的MWC世界移動大會。
Waverley Lab成立于2014年,據(jù)CEO Andrew Ochoa表示,成立這個公司的初衷是……他遇到了一個法國女孩,想要和對方交流卻苦于存在語言障礙。目前公司核心成員有5位,除了CEO Andrew Ochoa外,還有硬件工程副總裁Jainam Shah、生產制造副總裁William Goethals、設計副總裁Sergio Delrio Diaz、以及市場營銷副總裁Marion Guerriero。
(MWC上Waverley Lab的展臺)
這款無線翻譯耳機需要配合手機App,使用藍牙相連,使用時交談雙方各戴著一只耳機。目前預售版支持五種語言的同聲傳譯(英語、法語、意大利語、葡萄牙語、西班牙語)官網顯示今年秋季時用戶還可以額外購買中文、德語、日語、波蘭語、希臘語等眾多額外語種。
當然啦,就像其他所有無線耳機一樣,你還可以直接用它來聽音樂,目前有紅、白、黑三種顏色可供選擇。而最為神奇的是,這款耳機你也可以在神奇的淘寶上找到大量非官方預售鏈接……
二、翻譯機
除了翻譯耳機外,一個扁平的長方形狀翻譯機也是翻譯硬件的常見形態(tài)。有的會帶一小塊屏幕,將識別/合成的文字顯示在屏幕上,有的則沒有屏幕,只能進行語音翻譯。
1、科大訊飛――曉譯翻譯機
這款曉譯翻譯機可以算得上是“網紅翻譯機”了,在去年11月23日的2016年度發(fā)布會上,科大訊飛推出了一款“曉譯翻譯機”,能夠實現(xiàn)了中英互譯或是漢維互譯。
這是一個類似小型遙控器的扁平長方形裝置,有一紅一藍兩個語言的摁鈕,說英語或者維吾爾語之前需要摁下相應摁鈕。今年3月10日,也有國家領導人體驗了曉譯翻譯機,這消息當時還被小小刷了個屏。
2、雙猴科技――魔腦系列翻譯機
雙猴科技是一個比較神奇(神秘)的企業(yè),除了官方宣傳稿件外網絡上能查到的信息幾乎為零。就在上周,他們剛剛在海南舉行了一場發(fā)布會,推出了魔腦神筆、魔腦曉秘、魔腦導游、魔腦翻譯官四款產品。其中魔腦神筆與本欄中介紹的其他翻譯機類似,除了號稱支持28國語言的同聲傳譯外,還同時具備了錄音與語音/文字轉換功能,售價1999人民幣。
雙猴科技成立于2015年,公司位于海南國際旅游島,產品總部位于深圳南山科技園。據(jù)公司官網顯示,公司累計投入資金3000多萬元,目前擁有大圣文化系列完整的自主知識產權(大圣魔腦品牌+大圣IP+大圣語音庫+大圣語義)。
3、分音塔――準兒翻譯機
準兒翻譯機由分音塔科技在今年5月于京東上線眾籌的一款帶屏幕的翻譯機,眾籌價格約為699-799元。跟其他翻譯機一樣,準兒翻譯機需要用戶摁下摁鈕進行講話,然后再由機器進行翻譯,你說的話與翻譯出來的句子都會被顯示在屏幕上。目前準兒翻譯機支持中文、英文、日文、韓文、泰文等語種的互譯,不需要連接手機,但仍舊需要依靠網絡連接。
分音塔科技成立于2016年7月15日,兩位創(chuàng)始人CEO關磊與CTO張明都為清華大學的碩士。公司于2017年5月宣布完成千萬人民幣的天使輪融資,由東方國獅領投。目前準兒翻譯機的京東眾籌已經完成,根據(jù)眾籌頁面顯示,有5086名用戶支持了這項眾籌計劃。
4、Logbar――ili(咿哩)翻譯機
與它的一眾同類產品相比,由日本Logbar公司打造的ili(咿哩)翻譯機可以說是其中最早宣布產品,卻又相對功能最少的一個。早在2016年1月,Logbar就在當年的CES上推出了這款ili翻譯機,但一直到今年的5月,公司才宣布第一批產品開放預售,售價189美元。目前第一批ili翻譯器已經全部售完,預計10月發(fā)貨。
每個ili翻譯機都被編程為只能將一種特定語言轉換為另一種語言,比如當一臺ili翻譯機被設定為只能將英語轉換為日語后,就不能進行其他語言的轉換。而且它現(xiàn)在只能支持單向對話,即一臺ili被設定為英文轉日語后,是不能進行日語轉英文這種操作的……
目前,ili支持英文、西班牙語、普通話、日語的翻譯。但是由于這臺翻譯機不用聯(lián)網,因此其詞匯僅限于旅行者可能使用的單詞和短語,例如關于交通,購物或餐飲的咨詢。
三、統(tǒng)計機器翻譯+人工神經網絡翻譯
機器翻譯的歷史最早可以追溯到幾十年前。1954年,美國喬治敦大學(Georgetown University)與IBM公司聯(lián)合使用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕,幾十年間演進出了眾多不同的翻譯方法。
隨著互聯(lián)網的誕生與興起,新世紀以來,人類所產生的語言文字數(shù)據(jù)量激增,統(tǒng)計方法因此得到充分應用。谷歌、百度、微軟等互聯(lián)網公司紛紛成立機器翻譯研究組,研發(fā)了基于互聯(lián)網大數(shù)據(jù)的機器翻譯系統(tǒng),從而使機器翻譯真正走向實用,
自2013年已以來,隨著深度學習在圖像、語音等方面的突破性進展,基于人工神經網絡的機器翻譯( Neural Machine Translation )也在逐漸興起,翻譯效果變得越來越好。
簡而言之,統(tǒng)計機器翻譯讓機器學著如何翻譯短語或單詞詞組,例如,一個組合可以是“我的藍色車”=>“my blue car”或“blue car”=>“藍色車”。每個組合獲得一個評分,用來評價翻譯正確的程度(被用戶使用)。電腦將會嘗試組合不同的詞組組合來產生句子的翻譯,以達到最大化的翻譯流利程度。這些組合的合集類似于人們在旅游中使用的《100句帶你游遍美國》,但傳統(tǒng)的翻譯系統(tǒng)具有數(shù)以億計的翻譯組合規(guī)則。
基于人工神經網絡的機器翻譯更像一個黑匣子。大多數(shù)這些翻譯系統(tǒng)使用“編碼器-解碼器”模型。“編碼器”將每個原文單詞轉換為數(shù)字向量序列,“解碼器”通過從每個向量中挑選信息來生成一個譯文單詞。“注意模型(attention model)”對每個向量進行加權,以決定原文句子的哪些編碼部分有助于產生下一個翻譯的單詞。與深度學習的其他應用一樣,我們并不知道機器是依靠什么標準判斷的,然而在大多數(shù)情況下,基于人工神經網絡的機器翻譯更流暢。
目前,許多企業(yè)使用的都是人工神經網絡機器翻譯+統(tǒng)計機器翻譯等綜合技術進行翻譯。
結語:小紅海?偽需求?
隨著經濟發(fā)展與國民生活水平的提升,越來越多的民眾開始選擇出國旅行作為休閑娛樂方式,而語言溝通障礙作為一個用戶痛點,正越來越多地被人察覺。而上文提到的幾乎所有翻譯機/翻譯耳機,瞄準的幾乎都是旅游這種精準率低、容錯率高的用戶需求――至于商務會談的同聲傳譯,暫時還是無法由機器替代的。
旅游翻譯的需求固然存在,但翻譯機的需求,我們可能要打上一個問號。一方面,在智能手機全民普及、所有需求可以被App滿足的當下,一個功能單一的硬件產品是否有市場?這些翻譯硬件的效果跟我們熟悉的谷歌翻譯App、百度翻譯App等比較起來效果如何?而且,目前大部分產品還是停留在摁一下,說一句,翻一句的方式,不能提供同聲傳譯,這與使用App翻譯非常相似(文中提到的所有企業(yè)幾乎都提供免費的翻譯App)。
另一方面,如果這個翻譯機需要依靠網絡,那么現(xiàn)有網絡水平是否能夠保證偏遠地區(qū)的網絡通暢?而如果這個翻譯機不需要依靠網絡,那么翻譯效果、翻譯的準確程度是否能夠得到保障?企業(yè)在宣傳過程中多少功能能夠實現(xiàn)?……這些問題都有待時間來驗證。
在此之前,還是先把英語學好吧。
1.TMT觀察網遵循行業(yè)規(guī)范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創(chuàng)文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創(chuàng)的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。