看似簡(jiǎn)單的「嘿 Siri」背后,藏著蘋果多少小心思?金融
這一次隨著 iOS 11 系統(tǒng)的到來(lái),我們也看到 Siri 獲得了不少的改進(jìn)。比如說(shuō)獲得了短語(yǔ)翻譯的功能、可以化身成為個(gè)人 DJ 、用戶界面的改進(jìn)等等,而在這些改進(jìn)的背后隱藏著很多的努力與心思。
摘要:蘋果的一篇文章詳細(xì)介紹了硬件、軟件和互聯(lián)網(wǎng)服務(wù)如何結(jié)合在一起,在最新的 iPhone 和 iPad Pro 上實(shí)現(xiàn)「嘿 Siri」的功能。
Siri 這個(gè)功能對(duì)于很多人來(lái)說(shuō)并不陌生,一句簡(jiǎn)單的「嘿 Siri」就可以將其激活,讓它為你查天氣,查日程,甚至可以「調(diào)戲」它。但你卻不知,簡(jiǎn)單的「嘿 Siri」背后其實(shí)一點(diǎn)也不簡(jiǎn)單,Siri 背后隱藏了非常多的努力與心思。
蘋果今天在公司機(jī)器學(xué)習(xí)的博客上發(fā)布了一篇新文章(http://t.cn/RODZjvu),文章詳細(xì)介紹了硬件、軟件和互聯(lián)網(wǎng)服務(wù)如何結(jié)合在一起,在最新的 iPhone 和 iPad Pro 上實(shí)現(xiàn)「嘿 Siri」的功能。文章專業(yè)性較強(qiáng),極客公園進(jìn)行了編譯和刪減,為大家介紹「嘿 Siri」的基本原理。
「分?jǐn)?shù)」及格才能使用 Siri
蘋果在運(yùn)動(dòng)協(xié)處理器中集成了非常小的語(yǔ)音識(shí)別裝置,這個(gè)裝置一直保持運(yùn)行,并等待用戶說(shuō)出「嘿 Siri」。當(dāng)該裝置識(shí)別到這兩個(gè)單詞后,iPhone 或 Apple Watch 上的麥克風(fēng)會(huì)以每秒 1.6 萬(wàn)次的速度將你的聲音轉(zhuǎn)化為一連串的瞬時(shí)波形樣本。每次將大約 0.2 秒的音頻輸入到聲學(xué)模型,神經(jīng)網(wǎng)絡(luò)會(huì)將這些聲學(xué)模型轉(zhuǎn)換為概率分布,并使用時(shí)間集成來(lái)計(jì)算「嘿 Siri」的信度分?jǐn)?shù)。
蘋果已經(jīng)設(shè)定了信度分?jǐn)?shù)的幾個(gè)敏感閾值,如果分?jǐn)?shù)足夠高,Siri 就被激活,并開始處理用戶的命令或查詢。如果分?jǐn)?shù)超過(guò)了最低閾值,但沒(méi)有達(dá)到激活的閾值,比如「嘿 Siri」的發(fā)音并不是很清楚,這時(shí)設(shè)備會(huì)在幾秒鐘進(jìn)入「敏感模式」,這樣當(dāng)用戶再次重復(fù)「嘿 Siri」時(shí),可以更好的激活,敏感模式的加入大大改善了 Siri 的可用性。當(dāng)然如果信度分?jǐn)?shù)連最低閾值都沒(méi)有超過(guò),Siri 根本就不會(huì)「搭理」你。
準(zhǔn)確識(shí)別你的「嘿 Siri」
為了減少或者說(shuō)意外激活 Siri,蘋果在邀請(qǐng)用戶進(jìn)行初始化「嘿 Siri」的時(shí)候,會(huì)要求我們連續(xù)說(shuō)五次「嘿 Siri」,在初始化完成后,我們的聲音會(huì)轉(zhuǎn)化成波形并送達(dá)到 Siri 的服務(wù)器里。與此同時(shí),蘋果還制定了一些與語(yǔ)音相關(guān)的規(guī)范,發(fā)音接近 Siri 的「Syria」(敘利亞) 和「serious」(嚴(yán)肅的) 等詞語(yǔ)將被放在上下文中進(jìn)行識(shí)別。
這一方式不僅提高了激活 Siri 的成功率,同時(shí)還有效的避免其他人誤開 Siri。而在之后的使用過(guò)程中,蘋果會(huì)記錄不同環(huán)境中遠(yuǎn)近激活「嘿 Siri」的情況,比如在廚房里、車?yán)铩⑴P室里等等。
并不是一直等你「嘿 Siri」
iPhone 或 Apple Watch 激活 Siri 不僅要求快速準(zhǔn)確,還要求不會(huì)對(duì)電池的壽命產(chǎn)生重大的影響以及盡可能少的占用內(nèi)存和處理器。為了避免主處理器一直處于檢測(cè)觸發(fā)詞的狀態(tài),iPhone 中的 AOP(一種小且低能耗的處理器)會(huì)使用其一小部分處理能力來(lái)運(yùn)行一個(gè)探測(cè)器和一個(gè)小版本的聲學(xué)模型。當(dāng)信度分?jǐn)?shù)超過(guò)最低閾值時(shí),AOP 會(huì)「提醒」主處理器進(jìn)行下一步操作。
而 Apple Watch 在整合 Siri 時(shí)遇到的困難更大一些,因?yàn)樗碾姵厝萘亢吞幚砟芰Χ枷鄬?duì)更小。為了避開這些問(wèn)題,Apple Watch 的「嘿 Siri」檢測(cè)器只有在手表啟動(dòng)時(shí)才會(huì)運(yùn)行,它可以檢測(cè)到手腕抬起的手勢(shì)。只有用戶做出這樣的手勢(shì),手表才會(huì)打開屏幕,之后激活 Siri。
其實(shí) Siri 誕生以來(lái),每一次隨著蘋果系統(tǒng)的更新,Siri 同樣也會(huì)獲得更多的進(jìn)步。就像這一次隨著 iOS 11 系統(tǒng)的到來(lái),我們也看到 Siri 獲得了不少的改進(jìn)。比如說(shuō)獲得了短語(yǔ)翻譯的功能、可以化身成為個(gè)人 DJ 、用戶界面的改進(jìn)等等,而在這些改進(jìn)的背后隱藏著很多的努力與心思。
來(lái)源:極客公園
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。