谷歌翻譯來勢洶洶,技術如何落地將決定下一賽程的結果觀點
在不同業務背景的加持下,未來各個翻譯公司的外延產品差距會逐漸拉大,能否回籠前期的投入資金,才能決定最后的贏家。
彼此相安無事幾年后,國產翻譯軟件們正在遭遇最強外敵。
近期,谷歌翻譯在微信朋友圈投放一系列廣告,用于展示谷歌翻譯Word Lens(即實時相機翻譯)的功能。
在中國市場沉寂多時后,這是谷歌久違的動靜。科技迷對于這次廣告試水也顯得相當興奮,長句翻譯、專業術語甚至外延產品谷歌實時翻譯耳機,都成為了關注的焦點。
這加劇了翻譯市場的緊張氣氛。外界不斷將國產翻譯軟件與谷歌翻譯進行對比,議論哪個競品需要擔心。
對比用戶們的躍躍欲試,在國內市場扎根多年的國產翻譯軟件們正互相觀察,試圖找到一個答案:勁敵當前,誰或成為最大輸家?
一、進擊的谷歌
這不是谷歌翻譯第一次在朋友圈投放廣告。
今年3月29日,谷歌翻譯App更新至5.8版本,不僅增加了Word Lens功能(意為通過神經網絡識別圖像中的文字,然后再轉化成對應所需求的文字),更重要的是,其App首次對中國用戶開放。彼時,谷歌翻譯也投放了一系列廣告。
和3月的投放相比,近期的廣告依然集中推廣Word Lens、語音翻譯和手寫翻譯功能。只是將主題設定為城市探索,同時邀請今年嘻哈熱潮中的代表人物“HipHopMan” 歐陽靖進行宣傳,以吸引更多年輕用戶。
屢次投放廣告,谷歌翻譯對于中國市場的迫切由此可見。雖然在過去八年中,中國用戶可以在網頁端使用谷歌翻譯,但移動端應用的缺席,讓谷歌翻譯在中國市場失去了不少機會。
此次移動端應用終于落地,谷歌展開一系列攻勢也屬正常。面對谷歌的強烈攻勢,國內的翻譯軟件們應該緊張嗎?
至少以目前的功能看,每家都大同小異。從輸入法看,目前的翻譯App都提供鍵盤輸入、手寫輸入、語音輸入、攝像頭采集等多種場景下的服務;此外,提供的翻譯服務從過去的詞組、句子翻譯升級為整段翻譯、語音翻譯、實景翻譯等。不僅如此,各家翻譯App還通過語言包開啟了離線翻譯功能。
除了以上種種,谷歌翻譯還提供 “點按翻譯”(Tap to translate),意味著可以直接在其他App上使用Google翻譯而無需切換界面,升級用戶體驗。
既然功能相似度極高,“后浪”谷歌憑借什么逼近國產翻譯軟件的護城河呢?
區別各類翻譯軟件的,不是表面各項功能,而是功能背后的技術。經過PBMT(基于詞組的機器翻譯)與SMT(統計翻譯模型)時代的競爭,如今翻譯技術已經進入了NMT(神經網絡翻譯)時代。此前,PBMT的翻譯單位是詞組,無法解決詞序和語法問題,因此在長句及專業表達上顯得差強人意。
如今,NMT卻嘗試反其道行之:將整句作為翻譯單位,利用上下文信息進行多義詞的判定,最后進行邏輯性的關聯翻譯。相比之下,NMT的翻譯成果更接近日常用語習慣。
同時,NMT系統會收集用戶反饋訓練自身,利用大數據倒推新的規則以補充知識圖譜。目前,谷歌、微軟、有道、科大訊飛、百度等巨頭在翻譯方面均更新了NMT系統,以期在AI時代一決勝負。
而谷歌翻譯,在數據運用方面無疑具有更多的話語權。在2006年翻譯業務上線后,谷歌以搜索引擎的身份不斷收集數據,而開發的安卓系統更是在搜集移動數據方面助力良多。如吳軍在《智能時代》里所描述的,2005年谷歌翻譯曾憑借更多的數據,在美國翻譯界大賽上秒殺老牌翻譯公司。
憑借深厚的積累,谷歌在大數據時代的競爭中給對手們帶來了更多的壓力。
二、群雄逐鹿
在龐大而充滿變數的中國市場,不斷打廣告的谷歌,并非如外界想象得信心滿滿。
將NMT運用于翻譯,谷歌并非行業第一人。早在2015年,百度就上線了世界上首個NMT系統,而谷歌則在2016年才推出類似的系統。
在中國市場,姍姍來遲的谷歌面對人滿為患的競技場,需要展示更多的優勢吸引用戶。
雖然谷歌在數據領域已是專家,但在中文數據搜集方面,由于用戶的使用習慣和頻率,谷歌并不具備優勢。
同時,當業內的競爭者都完成技術升級后,谷歌翻譯在十年前靠海量數據形成的優勢將逐漸消弭。
某種程度上,谷歌翻譯和國內翻譯軟件站在了同一起跑線上。復旦中國研究院副研究員余亮向筆者表示,技術上各家處于同一個層次,技術如何落地將決定下一賽程的結果。
想要跑贏翻譯競爭的后半段,硬核在于信息基礎。余亮表示,翻譯技術身后需強大的技術庫以及知識圖譜作為支撐。知識圖譜作為人工智能大腦的基礎,需要耗費大量的資源構建。同時,在海量搜索的數據間建立復雜、多維的聯系,通過對語言的分解、關聯以及數據化進行訓練后,形成龐大的知識庫,以獲得對提問自動判斷的能力。
雖然NMT潛力巨大,現階段牢牢把握中國用戶的是有道翻譯。在NMT出現之前,外界的聚光燈集中于有道翻譯。
比達咨詢(BDR)5月的監測數據顯示,國內語言工具類APP月活躍用戶數方面,有道詞典月活躍用戶數為4312.2萬人,而第二名金山詞霸為926.5萬人,兩者之間差距不小。
在進入NMT時代之前,有道詞典憑借良好的用戶體驗以及UI設計獲得了用戶青睞。
今年5月,有道翻譯上線了NMT翻譯技術,遲到的NMT技術能幫助有道持續占領翻譯市場嗎?
恐怕很難。在未來翻譯戰爭中,搜索引擎扮演了關鍵角色。基于用戶的百億搜索量,搜索引擎公司相對于其他互聯網公司,將積累更多的數據。這將幫助神經系統不斷訓練與打磨,成熟度會遠高于其他的互聯網公司神經系統。
11月,在2017世界人工智能大會上,百度副總裁、AI技術平臺體系總負責人王海峰就曾表示,百度正在打磨知識圖譜。
不僅是余亮,曾在谷歌和騰訊工作過的吳軍也曾公開表示過,未來在翻譯領域前兩名將會是谷歌與百度。因為二者都以搜索引擎起家,在數據搜集上有先天的優勢,而這一優勢今后會發揮馬太效應,逐步擴大。
三、落地為王
長期以來,翻譯服務一直被認為是巨頭扎堆的小市場,盈利不易但技術投入巨大。除了百度、谷歌等面世許久的翻譯軟件,騰訊前不久也推出了“騰訊翻譯君”,該產品用于中英同聲傳譯服務。
今年7月,阿里巴巴披露的一份技術資料顯示,阿里翻譯團隊通過優化阿里云機器學習平臺PAI,應用于英俄電商翻譯質量優化項目中。
同一時段,大洋彼岸的Facebook也宣布面向全球推出NMT,用于Facebook中上百種語言的翻譯,并且達到每天45億次的翻譯量。
一時間,全球的互聯網巨頭都在翻譯市場發力。
巨頭的涌入不能說明翻譯市場的吸金力。2013年9月,有道詞典宣布在第三季度實現盈利。但除了有道,排名第二的金山詞霸至今在盈利問題上含糊其辭。
在今年5月,北京金山辦公軟件股份有限公司(以下簡稱“金山辦公”)披露了招股說明書,卻未公布WPS Office辦公軟件和金山詞霸的財務數據。
既然盈利不易,為什么巨頭對這片市場充滿了征服欲呢?其實,在翻譯技術身后,有無數的外延產品,這將為巨頭們帶來新的紅海。
在國外,谷歌正在重點推谷歌home,即谷歌智能家居,作為一個家庭互聯網的入口,與亞馬遜爭斗市場份額。在國內,幾家互聯網巨頭都已推出智能音箱。
以最近的零售大戰數據看,雙十一期間天貓精靈售出100萬臺,在國外黑色星期五期間,亞馬遜Echo智能音箱銷售約為800萬臺。
僅是智能音箱一項,就可以為公司帶來不小的收益。而在技術成熟后,落地產品將會越來越多。余亮表示,谷歌和百度這類搜索公司,愿意暫時燒錢在翻譯市場,其實是嘗試互聯網的“破壞式創新”,未來在數據積累達到一定程度時,百度和谷歌將通過別的業務賺錢。
而如網易這類在AI上沒有過多技術基礎的公司,正在嘗試教育方向的延伸,例如網易課堂。
在不同業務背景的加持下,未來各個翻譯公司的外延產品差距會逐漸拉大,能否回籠前期的投入資金,才能決定最后的贏家。
谷歌的入局不會宣布輸家的人選。相反,這場由NMT開始的翻譯大戰,才剛剛開始。
(來源:鈦媒體 作者:陸涵之 )
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。