微軟語音識(shí)別出錯(cuò)率達(dá)5.1%創(chuàng)新低 比肩專業(yè)速錄員通信
這兩次研究轉(zhuǎn)錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對(duì)話,自上世紀(jì)90年代以來一直被研究人員作為測(cè)試語音識(shí)別系統(tǒng)的樣本。
導(dǎo)語:這兩次研究轉(zhuǎn)錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對(duì)話,自上世紀(jì)90年代以來一直被研究人員作為測(cè)試語音識(shí)別系統(tǒng)的樣本。
據(jù)科技博客TechCrunch北京時(shí)間8月21日?qǐng)?bào)道,微軟公司在當(dāng)?shù)貢r(shí)間周日宣布,其對(duì)話式語音識(shí)別系統(tǒng)的出錯(cuò)率達(dá)到5.1%,創(chuàng)下目前為止的最低水平,超過了去年微軟人工智能及研究事業(yè)部一組研究人員所實(shí)現(xiàn)的5.9%出錯(cuò)率,達(dá)到了專業(yè)速錄員的同等水平。在此次研究中,專業(yè)速錄員具備重復(fù)收聽錄音等優(yōu)勢(shì)。
這兩次研究轉(zhuǎn)錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對(duì)話,自上世紀(jì)90年代以來一直被研究人員作為測(cè)試語音識(shí)別系統(tǒng)的樣本。
新研究由微軟人工智能及研究事業(yè)部的一組研究人員實(shí)施,目標(biāo)是在出錯(cuò)率上達(dá)到一組速錄員的同等水平,后者可以反復(fù)收聽錄音樣本,了解對(duì)話語境,與其他速錄員合作。
整體來說,通過改進(jìn)微軟語音識(shí)別系統(tǒng)中基于神經(jīng)網(wǎng)絡(luò)的聽覺和語言模型,實(shí)施最新研究的研究人員能夠在去年基礎(chǔ)上把出錯(cuò)率降低大約12%。顯然,他們還可以讓語音識(shí)別器了解整體對(duì)話,適應(yīng)錄音樣本的語境,預(yù)測(cè)對(duì)話中很可能出現(xiàn)的下一個(gè)詞匯或短語。這正是人類在與其他人對(duì)話時(shí)的做法。
微軟的語音識(shí)別系統(tǒng)已被用于語音助手“小娜”、實(shí)時(shí)翻譯字幕功能PresentationTranslator以及微軟認(rèn)知服務(wù)中。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。