蘋果再出手整治iMessage垃圾信息轟炸:這次請(qǐng)來了AI會(huì)管用嗎?互聯(lián)網(wǎng)+
使用AI反垃圾,保護(hù)你的iMessage
一鳴網(wǎng)8月6日前沿觀察:(謝東霞關(guān)注人工智能、物聯(lián)網(wǎng))上周,蘋果股價(jià)盤中突破204.83美元,市值達(dá)到1萬億美元。作為當(dāng)今全球最會(huì)賺錢,現(xiàn)金儲(chǔ)備最多的公司,國內(nèi)的廣大果粉們卻陷入垃圾短信的圍剿。
很多蘋果用戶反應(yīng)iMessages的垃圾短信越來越多,舉報(bào)也不起作用,每天都要收到三四條賭場(chǎng)、博彩廣告,開發(fā)票廣告、貸款之類的內(nèi)容。7月31日,央視新聞也點(diǎn)名批評(píng)了蘋果的信息管理。
面對(duì)iMessages越來越嚴(yán)重的垃圾信息困擾,蘋果相關(guān)負(fù)責(zé)人透露,正在跟國內(nèi)的電信企業(yè)接觸,并探索其他可采取的方法來減輕垃圾信息帶來的困擾。包括采用更先進(jìn)的機(jī)器學(xué)習(xí)模型識(shí)別垃圾信息,以及推出更多的工具來阻止惡意發(fā)件賬號(hào)。
AI反垃圾的建立
在此時(shí),一個(gè)AI All in的時(shí)代,人工智能幫我們做的事越來越多了,這次蘋果公司想用人工智能保護(hù)用戶不受垃圾信息的侵?jǐn)_,需要怎樣的機(jī)器學(xué)習(xí)模型呢?
1.保持反饋?zhàn)钚』⒈M可能延遲反饋,確保攻擊者在探查你的系統(tǒng)時(shí)得到盡可能少的收獲。
2.限制攻擊者對(duì)你的系統(tǒng)執(zhí)行測(cè)試的頻率,有效降低他們?cè)O(shè)計(jì)有害有效負(fù)載的速度。
3.結(jié)合各種檢測(cè)機(jī)制,增加攻擊者繞過整個(gè)系統(tǒng)的難度。使用集成學(xué)習(xí)將基于聲譽(yù)的檢測(cè)方法、人工智能分類器、檢測(cè)規(guī)則和異常檢測(cè)等不同類型的檢測(cè)方法結(jié)合起來,提高了系統(tǒng)的魯棒性,因?yàn)椴涣夹袨檎卟坏貌煌瑫r(shí)制作避免所有這些機(jī)制的有效載荷。
AI反垃圾的優(yōu)勢(shì)
人工智能在垃圾消息防御方面的應(yīng)用早有先例,去年Instagram的工程師,將標(biāo)記為垃圾評(píng)論或非垃圾評(píng)論的數(shù)據(jù)的輸入deep text,訓(xùn)練基于帖子內(nèi)容本身以及其他因素來辨認(rèn)負(fù)面評(píng)論的人工智能,其嘗試使用九種不同的語言來檢測(cè)垃圾郵件或冒犯性的評(píng)論。試圖幫助 Instagram 成為一個(gè)讓用戶舒服表達(dá)自己的平臺(tái),不被攻擊或冒犯。
為了國內(nèi)網(wǎng)民免遭大量垃圾郵件、垃圾短信、騷擾電話等網(wǎng)絡(luò)垃圾的轟炸,網(wǎng)易在2016年發(fā)布了易盾智能反垃圾云服務(wù)。依托網(wǎng)易反垃圾海量特征樣本庫,使用人工智能、大數(shù)據(jù)分析技術(shù),對(duì)用戶存儲(chǔ)在對(duì)象存儲(chǔ)上的圖片數(shù)據(jù)進(jìn)行高效甄別,并對(duì)涉及廣告、色情、違禁、暴恐等垃圾類型的圖片數(shù)據(jù)進(jìn)行嫌疑程度的判斷,同時(shí)為用戶提供準(zhǔn)確便捷的檢測(cè)結(jié)果展示平臺(tái)。比起企業(yè)自建內(nèi)容審核體系,網(wǎng)易易盾能幫企業(yè)降低80%的運(yùn)營成本。
AI反垃圾的局限
不過機(jī)器學(xué)習(xí)模型仍存在一定的局限性。Instagram判斷評(píng)論具有冒犯性的方式,是通過機(jī)器給每一條評(píng)論進(jìn)行0到1風(fēng)的評(píng)級(jí),分?jǐn)?shù)越高,評(píng)論內(nèi)容越惡劣。到達(dá)一定限度后,評(píng)論就會(huì)被抹除。不過在Instagram的系統(tǒng)中就會(huì)存在1%的誤報(bào)比例,這就意味著機(jī)器刪除的評(píng)論中,有1%是用戶實(shí)際可以接受的。
機(jī)器學(xué)習(xí)依舊會(huì)在內(nèi)置規(guī)則的影響下具有一定的局限性,文本分析公司Luminoso的首席科學(xué)家Rob Speer基于詞嵌入理論創(chuàng)建過一套算法,試圖分析文本內(nèi)容的傾向性。他用人們對(duì)于餐廳的評(píng)價(jià)作為語料進(jìn)行測(cè)試卻得到了意料之外的結(jié)果:人們墨西哥餐館評(píng)價(jià)很低,而事實(shí)情況則是墨西哥餐廳頗受歡迎。后來Rob Speer通過數(shù)據(jù)發(fā)現(xiàn)系統(tǒng)從網(wǎng)頁上學(xué)到了墨西哥一詞,而在互聯(lián)網(wǎng)上,墨西哥一詞往往與“非法”等負(fù)面詞匯相關(guān)聯(lián),對(duì)于算法來說,這意味著一些負(fù)面的東西。
雖然人工智能不能達(dá)到人們心中的理想效果,對(duì)文本內(nèi)容的評(píng)價(jià)有時(shí)會(huì)有偏差,對(duì)于一些模棱兩可的內(nèi)容難以判斷,但也足夠拯救國內(nèi)果粉們被垃圾短信轟炸的慘況,希望蘋果能盡快實(shí)施反垃圾的措施。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。