麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

智能音箱們,亞馬遜Echo的成功再難復制了智能

虎嗅會員小秘書 2018-03-30 21:40
分享到:
導讀

有一種說法,2018年,智能音箱一準爆發(fā)。

有一種說法,2018年,智能音箱一準爆發(fā)。的確,在2017年,BAT輪番推出智能音箱,Rokid、出門問問等創(chuàng)業(yè)公司也趁勢布局,國內(nèi)智能音箱的出貨量也從十幾萬上升到百萬級,資金高速涌入,中國“百箱大戰(zhàn)”將正式拉開序幕。

盡管,整體看好智能音箱未來市場,甚至有預測稱2018年全球出貨量將達到5630萬臺;但也有相對保守派認為,2018年智能音箱行業(yè)并不會爆發(fā),主要依據(jù)智能音箱的語音交互能力較弱、內(nèi)容服務生態(tài)不足、跨場景跨任務對話能力較差等因素。

思必馳的CMO龍夢竹,就持后一種觀點。思必馳是國內(nèi)為數(shù)不多擁有自主知識產(chǎn)權(quán)中英文綜合語音技術的公司,其客戶包括阿里、騰訊、小米、海爾、聯(lián)想等,對于語音識別技術的現(xiàn)狀,思必馳是具備發(fā)言權(quán)的。

眼下,智能音箱市場有點冰火兩重天的意味。在不久前剛過去的2018CES(消費電子展)上,智能音箱頗受矚目,被視為家庭場景的最佳智能入口,可國內(nèi),雖然BAT、小米等巨頭紛紛入局,但出貨量并不可觀,這讓智能音箱在國內(nèi)的處境有了幾絲尷尬。

到底智能音箱是否是偽需求,語音交互是否符合中國的國情?

的確,基于家庭場景的智能生活正在燃爆下一個消費級市場,至于這個場景是不是由智能音箱來帶動,卻是個未知數(shù)。

由此,虎嗅“大咖私房話”邀請到思必馳CMO龍夢竹與虎嗅會員進行了一場2小時的圓桌對談,分享了她對當前智能音箱發(fā)展、機遇的理解,剖析了未來智能音箱發(fā)展趨勢以及在聲紋識別上的技術突破與當下瓶頸。我們將現(xiàn)場錄音整理出來,復現(xiàn)了這場對話,干貨滿滿。

想了解更詳細的案例分享、全部圖文,以及深度問答,歡迎加入虎嗅會員解鎖分享內(nèi)容全文。 

Echo成為爆款的背后,反映的是國內(nèi)音箱市場崛起面臨的問題

首先一點,無論是百度Raven H,還是亞馬遜Echo,在一定程度上都是為了展現(xiàn)背后的對話定制平臺。在這樣的戰(zhàn)略目標下,他們做這樣的硬件根本沒有考慮盈利。

至于說Echo,Echo是集亞馬遜生態(tài)與資源優(yōu)勢為一體的集大成者,其成功并非偶然,成功的因素也未必能為國內(nèi)音箱市場崛起帶來普適性的借鑒,但其快速的發(fā)展必然會推動語音技術應用落地。

第一,音質(zhì)是選購音箱的首要條件,包括很多媒體都會做相關的評測,首先就是從音質(zhì)開始,低音、高音、杜比音效等等。

第二,性價比是用戶購買的關鍵因素,Echo在正式上市前,硬件已經(jīng)迭代了很多版本,成本投入很大,是沒太多收益的,只能是量產(chǎn)之后薄利多銷,而對終端消費者來講,需要的只是高性價比。比如去年有一款“折衣服機器人”,不管多亂的衣服,在十幾秒種時間都能迅速疊放整齊,但售價高達十萬塊,幾乎無人購買,所以,在價格與技術投入之間去掌握好平衡點才是關鍵所在。

第三,銷售渠道;Echo依靠的渠道是整個亞馬遜的生態(tài)服務,亞馬遜把AWS云服務、Kindle跟Echo進行整合,鋪設了很廣的銷售渠道。

第四,內(nèi)容服務;亞馬遜將音頻服務,包括Kindle、有聲讀物,全部融入到Echo內(nèi)容服務上,內(nèi)容資源得到充分積累。

第五,語音交互;Echo在技術上最顯著的代表性意義,則是把語音的遠場交互迅速落地,率先將遠場麥克風陣列集成在產(chǎn)品里,無論聲源定位、遠場喚醒、語音交互,都帶給用戶極其新鮮的產(chǎn)品體驗。

但Echo在中國的銷量還不理想,當然大部分原因是Echo目前沒有支持中文,以及在整個生態(tài)和內(nèi)容服務上沒有完全打通,這也給中國的音箱發(fā)展創(chuàng)造了非常好的條件。

眼前中國智能音箱的瓶頸在于:音箱們的智能交互體驗,跟語音交互技術、后端服務和生態(tài)合作都是相關的,而這幾點也恰恰是國內(nèi)音箱的劣勢。

以語音技術為例,當技術落地應用,語音其實只是交互的手段,并不是產(chǎn)品功能,效果的優(yōu)劣主要是由是否最終能滿足用戶需求來決定的,簡單說,好不好用是由語音技術,內(nèi)容打通能力等綜合決定的。

比如有些人買了某音箱,覺得還是不好用,就會問是不是語音技術有問題?語音技術什么時候能夠成熟?比如,當用戶對著音箱說“我要聽趙雷的《成都》”而產(chǎn)品反饋“對不起找不到您要的歌曲”,消費者下意識會認為是語音識別不好,搜不到歌曲,但這背后很有可能是音樂內(nèi)容提供商沒有這首歌的版權(quán);或者產(chǎn)品本身某個硬件模塊沒有選得特別好,比如芯片選擇不好可能會延長語音識別的時間。

對用戶來講,語音是用戶跟產(chǎn)品發(fā)生關系最直接的感受,于是所有的鍋,最后都是由語音技術來背。

國內(nèi)智能音箱整體上還未到爆發(fā)節(jié)點

很多人都在問2018年音箱能火起來嗎?

從語音交互、內(nèi)容服務,包括用戶的接受能力,其實還達不到音箱真正爆發(fā)的節(jié)點,音箱帶動的更多的是大眾對智能家居的認知,讓大家看到物聯(lián)網(wǎng)的發(fā)展及智能家居的未來,而真正能火起來的可能不一定是音箱,有可能是智能門鎖,智能路由等。

2018年應該會有中國本土的創(chuàng)業(yè)企業(yè)研發(fā)的智能門鎖大規(guī)模鋪向C端市場;再比如電視,電視在2018年、2019年會是個分水嶺,之后所有的電視應該全部都有語音功能。

但音箱目前還不具備成為剛需的條件,那為什么音箱會成為目前商家探路市場的首選?這是因為音箱本身是一個天然的、最好的音頻載體,第二,音箱比較輕量化,進入門檻相對較親民。

也許明年,市場上會出現(xiàn)更多類似于智能音箱的變體,比如音箱大部分是圓柱體,是為了收音和識音,還有音頻播放。但如果把音箱中部挖空,把它拔高,做成花瓶,那是不是就可以不用叫智能音箱了?

所以未來真正會爆發(fā)的是“智能助理終端”,真正能夠解決用戶交互需求,家居的控制等等,而不在乎是什么形態(tài)。

另外,中國作為一個農(nóng)業(yè)大國,對爆款產(chǎn)品的定義一定不是說產(chǎn)品體驗多好、價格多低,而在于賣的多好。要賣得好,渠道是很重要的因素。只有打入三四線市場,比如現(xiàn)在的手機,蘋果、華為炒的較熱,但OPPO、vivo,的市場占有率卻是非常大的,它們走的就是打入中國廣大的三四線市場,因為這一塊才是最有消費潛力的,而音箱如果在一兩年內(nèi)想打入三四線市場,可能沒有那么容易。

我們再說回今天的主題,智能音箱。

智能音箱只是外在的終端形態(tài),我們要評價智能音箱的好壞,就需要關注其背后的綜合能力,首當其沖的是智能語音技術。

從互聯(lián)網(wǎng)時代到移動互聯(lián)網(wǎng),再到物聯(lián)網(wǎng)時代,設備數(shù)量呈現(xiàn)指數(shù)級的增長,信息獲取也從文本信息處理發(fā)展到對話搜索。

隨著對語音技術、新場景的挖掘,物聯(lián)網(wǎng)市場迅速發(fā)展,智能硬件設備數(shù)量將達到100億量級,文本信息交互變得越來越弱,而語音和對話交互成為發(fā)展的需要,信息獲取也從終端為中心轉(zhuǎn)移到以用戶和場景為中心,這是整個時代的變革。

比如,在2014年的時候,以智能手環(huán)為代表的可穿戴市場開始興起,短時間內(nèi)國內(nèi)出現(xiàn)了幾千家做智能手環(huán)的企業(yè),但又迅速的銷聲匿跡。再到2016年基本上很少看到手環(huán)或者可穿戴產(chǎn)品的存在,而今年隨著整個AI技術,尤其是語音技術,還有新場景的挖掘,穿戴設備市場又將會慢慢地恢復起來。

聲紋識別雖是趨勢,但大規(guī)模商用還需時日

最近關于聲紋識別的討論很多,那我也來講一下這個事情。(虎嗅注:聲紋識別又稱說話人識別,是生物識別技術的一種。該技術通過語音波形中反映說話人生理和行為特征的語音參數(shù),進而分辨出說話人身份)。

我認為聲紋識別大規(guī)模商用的時機還遠遠不到。我說一下我的理由——

目前,聲紋識別目前分為兩種形式,一種叫說話人辨認-SI(Speaker Identification)

,屬于一對多的關系,就是在一群說話人中,通過去識別其中一個人音頻和信號去確認這個人是誰,應用的場景包括刑偵破案、罪犯跟蹤等;另一種叫說話人確認-SV(Speaker Verification),屬于一對一的關系,通過采集的數(shù)據(jù)來確認說話人,應用場景包括證券交易、支付購買、聲紋鎖等,民用場景應用性更強。

但目前在做聲紋識別方案的時候,通常是將聲紋作為一種輔助認證,把聲紋和人臉進行結(jié)合,雙重驗證,或者把聲紋跟傳統(tǒng)的密碼支付來進行綁定。但對于聲紋識別大規(guī)模的商業(yè)應用還需要時日,做好產(chǎn)品的交互體驗也是關鍵所在。

在聲紋識別里邊最大的難點,首先語言是一種時變的一維信號,語音聲音信號本身的問題,在于說話人語速、情緒、感官,甚至包括采集音頻的設備、變聲器的應用都會對聲音有一定影響,讓聲音的可信度有存疑;從算法上來說,包括建模、運算的能力,尤其是做聲紋數(shù)據(jù)庫的時候,去做什么樣的用戶聲紋驗證,有關年齡、職業(yè)分布、發(fā)音特質(zhì)都需要做建模,并且建立數(shù)據(jù)庫對樣本量的獲取都是難點。

尤其是智能家居大環(huán)境下,將會面臨以下幾個方向的挑戰(zhàn):

首先是噪音的干擾,也就是魯棒識別(魯棒即經(jīng)歷了各種信號處理或者各種攻擊后,依然具有一定的保真度),未來將會從算法降噪和硬件降噪來綜合提升體驗;

第二是家居環(huán)境下的遠場交互,目前主要是基于理想的家居環(huán)境中3~5米的距離來做核心優(yōu)化,之后會針對于酒店,甚至銀行大廳去做點對點的降噪嘗試;

第三是回聲消除、在設備播放聲音時的喚醒、打斷和交互。最后是提升交互體驗的其他必須技術點,包括聲源定位、聲紋識別等。

來源:虎嗅會員小秘書

音箱 智能 語音 識別 技術
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br> 3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。


專題報道

主站蜘蛛池模板: 日本视频在线观看播放 | 久久热r在线视频精品 | 99福利在线观看 | 无遮免费网站在线入口 | 红楼影视h38bar在线线播放 | 91精品国产人成网站 | 欧美腐剧mm在线观看 | 免费一级特黄特色大片 | 调教全程肉动画片在线观看 | 午夜欧美精品久久久久久久久 | 人人人人看人人人做人人 | 国产一卡二卡3卡4卡四卡在线 | 久久99re2热在线播放7 | 亚洲国产欧美目韩成人综合 | 色多多在线观看视频 | 探花国产 | juliaann主妇疯狂| 国产大片51精品免费观看 | 处女呦呦 | 国产在线精品成人一区二区三区 | 99热免费在线观看 | 视频在线观看高清免费看 | 单亲乱l仑在线观看免费观看 | 欧美一级视频在线 | japanhd粗暴video| 美女扒开腿让男人桶爽免费gif | 亚洲高清免费在线观看 | 无人在线高清免费看 | 京东热在线观看 | 香港论理午夜电影网 | 97精品国产自在现线免费观看 | 亚洲欧美日韩综合一区久久 | 男同gay作爰视频网站 | 久久这里只有精品视频9 | 欧美另类杂交a | 亚洲香蕉综合在人在线视看 | 色在线亚洲视频www 色欲麻豆国产福利精品 | 午夜精品久久久久久久99蜜桃 | 免费国产网站 | 国产精品51麻豆cm传媒 | 91夜色视频 |