讓AI入門者也能“克隆”今日頭條算法,一款產品如何實現 AI For Everyone?觀點
好的AI 模型,是應該給技術專家配一個業務顧問,還是給業務高手配一個技術工具?第四范式選擇了后者。
人工智能的商業化元年,一個問題擺在從業者面前:AI如何進入企業?在業務執行層面能給企業們帶來哪些改變?
不論是百度在整個2017年對無人駕駛系統與語音分析入口的全力押注,還是騰訊在成立 AI Lab 后與多款硬件結合“秀肌肉”的表現,自身具備技術能力的 BAT 無一不在結合自身業務和應用場景“ All in AI”。
除了內容推薦之外,今日頭條也將其強大的算法能力向商業領域——諸如廣告分發業務上拓展,AI能夠使消費者觸達環節變得更加精準。今日頭條創始人兼CEO 張一鳴就曾直言:“只要把 AI 更新一個模型,就可能會帶來幾個點的利潤。”
AI 對產業效率的提升、未來 AI 將成為如水電煤這樣的基礎設施,已經是業界共識。而相較于云服務、大數據,AI 與業務、與產品、與消費者的關聯將更加多元。
這也提出了另一個行業議題:如果說 AI 真的能像水電煤一樣讓消費者觸手可得,如何降低 AI 的門檻,讓更多人了解 AI 甚至能夠自行使用 AI ,同樣成為行業需要關注的問題。
“AI技術一定會快速普及,以后高中生就可以做AI。所以大家現在都在談 All in AI,本質上就是門檻低了。”在鈦媒體記者在烏鎮對獵豹移動 CEO 傅盛進行的采訪中,傅盛曾這樣表示。
第四范式創始人及CEO戴文淵
同樣是在烏鎮大會上,定位于幫企業搭建商用人工智能平臺的“第四范式”發布了其人工智能產品“先知”的最新版本——3.0系統。
用第四范式創始人及CEO戴文淵的話來說,“先知 3.0 ”可以讓公司里完全沒有技術背景的行政、前臺等員工,也能在一周之內經過培訓后,掌握基本的 AI 技術,甚至可以自行搭建一個根據喜好分發內容的推薦系統。
在戴文淵看來,AI 的應用推廣不能只依賴數據科學家這一小部分人群。“這就好比汽車的普及,現在考駕照也不難了,未來 AI 的應用也一定會朝大眾化的方向發展。”戴文淵告訴鈦媒體記者。
打造 AI 入門者可以構建今日頭條
兩年前的“第四范式”,還很孤獨。
2014年,戴文淵任職于百度營銷系統“鳳巢”。彼時他是百度最年輕的高級科學家,身背ACM世界冠軍等光環。在百度任期之內,戴文淵通過優化廣告投放規則,幫助百度將廣告收入提升了40%,而在這一過程中,戴文淵也更深地感觸到機器學習對于公司業務的有效提升。
因為不甘于只將 AI 應用在廣告業務,戴文淵在2015年創建“第四范式”。在戴文淵看來,百度曾經搭建一個 AI 系統動輒需要200-300人的科學家團隊,這對于大多數企業是無法承受的成本,當中還不算百度已經積累的計算資源與技術投入。因此,戴文淵希望能將當時稀缺的 AI 技術封裝到一個產品中,以商業套件的形式提供給企業。
不過,盡管這一定位從未改變,但誕生于2015年、身處眼下最為熱門的 AI 領域的創業公司,在彼時并沒有因為所謂的“人工智能”而受到關注——那一年創投風口還被 O2O 所占據;直到如今,隨著 BAT 對 AI 的空前重視,以及AI 落地場景的不斷涌現,“第四范式”提出的“AI For Everyone”才逐漸被外界了解。
那么,讓“小白用戶”借助第四范式的系統入門 AI ,是如何實現的?
在第四范式的總結中,企業 AI 系統需要具備三種核心能力:數據、算法、以及生產能力。因此,在第四范式最新發布的“先知3.0”中,就打通了從數據到業務的閉環,將機器學習產生智能的能力,與業務環節連接,形成了一個“機器學習圈”。
以今日頭條等個性化內容推薦應用為例,使用“先知3.0”構建這樣一個“千人千面”的智能系統大致需要四步:
1、行動。先讓系統推薦給用戶一些文章,或者根據用戶初始登陸時自行選擇的興趣標簽推薦一部分內容。
2、反饋。系統推薦得文章用戶是否瀏覽?瀏覽時間多長?是否連續瀏覽相同主題文章?這類用戶行為會演變為數據反饋給系統。
3、反思。通過以上的用戶行為數據,機器開始學習并總結用戶的閱讀喜好。
4、理論。針對用戶行為的反思結果生成一套通用理論,使應用的推薦更加精準,最終回歸到行動,并以此周而復始,不斷迭代。
以推薦系統為例,“先知3.0”通過構建機器學習圈的閉環,能夠讓普通員工掌握 AI 能力。
對于戴文淵來說,先知產品從1.0到3.0,同樣經歷了一個進化的過程。“2.0的時候,我們只能通過企業自行收集數據生成 AI 模型,這就讓’先知’高度依賴企業收集數據的準確性。”戴文淵說到。
由于大多企業收集數據會存在誤差——比如很多傳統企業只關注結果數據,不采集結果數據,這就好比機器只能了解員工一年工作的年末評定,卻不清楚員工每天做了什么,這就導致機器學習無法對未來的行為提供建設性建議。
因此,在先知3.0中,戴文淵帶領團隊設置了標準反饋數據的采集工具,同時對金融、醫療等行業設置了精細化的數據采集標準,確保企業能夠采集到 AI 所需要的數據。
數據科學家的兩條路徑
對于大眾來說,降低 AI 的認知門檻自然有一定意義,但是否有必要讓入門者——或者說公司的每個員工——都成為 AI 專家?
戴文淵向鈦媒體描繪了一個辦公室前臺都能使用的場景,“拿最近流行的人臉識別簽到系統來說,公司前臺只要收集全公司的人員照片,輸入到’先知’系統中,就可以生成一個人臉識別模型,再結合硬件設備,即可讓員工通過人臉簽到打卡。”
類似的案例還有很多。在第四范式目前合作最多的銀行客戶中,不少銀行內部員工就可以利用“先知”系統在超過20個日常業務中提升運營效率,為此,第三范式還特別成立了“范式大學”,針對企業內部普通員工,教會他們利用“先知”平臺,在四天內成長為一個初級的數據科學家。
那么,這是否能意味著數據科學家會就此失業?
在戴文淵看來,數據科學家的角色未來應朝兩個方向去發展。“一個更關注解決業務問題,比如解決一個反電信詐騙的問題,或者成為一個信息審核的專家。另一個就是往非常精深的底層技術發展,成為平臺背后關鍵技術的支撐點。”
這樣的角色差別事實上也反映出第四范式對 AI 產品及應用的定位。在人工智能科學領域,有一個問題也曾引發不少爭論:
好的 AI 模型,是應該給技術專家配一個業務顧問,還是給業務高手配一個技術工具?
對此,第四范式選擇了后者。“我們的數據科學家不僅要理解算法,更重要的是要求他們有對業務的理解能力和溝通能力,對業務有敏感度。”第四范式聯合創始人、首席架構師胡時偉說到。
在胡時偉看來,傳統意義上的數據科學家,需要編程/算法的經驗、數學理論的支持以及業務知識,但隨著市面上 Tensorflow(谷歌發布的深度學習開源框架)等算法開源以及“先知”這類產品的普及,編程、算法、理論都可以被封裝進產品中提供給大眾,掌握實際業務的重要性不言而喻。
目前,第四范式團隊已在消費金融、個性化推薦等領域擁有包括招商銀行、光大銀行、今日頭條等大量客戶,另外,第四范式還強調通過“遷移學習”的方式,將通用模型遷移到小數據上,使其個性化,從而在新的領域也能產生效果,以此在金融、電信、互聯網等更多行業打造百余個人工智能應用。
而對于 AI 應用的未來,戴文淵認為,AI 在應用場景上還有大量需求被壓抑著,企業不是不想做,而是限于技術門檻與人力成本,無法投入更多地資源去做,因此,戴文淵也著重強調在第四范式的公司定位中,除了人工智能領域公司以外,企業服務廠商的角色同樣重要。
“為企業提供系統的核心出發點是:必須時刻去想怎么幫助企業解決問題,而不是一味去考慮推一個什么形態的平臺。”戴文淵對鈦媒體記者說到。因此,第四范式對于 AI 系統的追求并不在于提供多么艱深的算法——那是學界研究的方向,第四范式對于算法的研究標準是“在同等水平的技術維度中,考慮能被更多人接受的產品模式”。
(來源:鈦媒體 作者:蘇建勛)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。