從“天鏡”大模型透視馬上消費自主性生存法則觀點

2023,堪稱大模型元年。
2023,堪稱大模型元年。
年初ChatGPT有如平地驚雷,炸開了大模型的應(yīng)用賽道。但有意思的是,一直熱衷于科技賦能的金融行業(yè)在大模型的開發(fā)上卻遲遲未有突破。
直到今年8月,馬上消費拔得頭籌,其自主研發(fā)的“天鏡”大模型上線,全國首個上線的零售金融大模型方才問世。這一開發(fā)和上線速度不僅超過了A股上市大行,也超過了阿里云、騰訊云這樣的科技巨頭。這為整個行業(yè)的發(fā)展提供了很強的標(biāo)桿意義。
在過去8年的時間里,馬上消費作為一家沒有強勢股東的數(shù)據(jù)供給、流量加持和外部技術(shù)助力的消費金融機構(gòu),不僅做到了穿越周期、風(fēng)雨不倒,云銷雨霽之后,還能保持優(yōu)異的增長速度和創(chuàng)新能力。這與其長期深耕消金這一垂直賽道不無關(guān)系,當(dāng)然,更重要的是,在科技這樣的資產(chǎn)密集、技術(shù)密集領(lǐng)域,馬上消費從不因為“重”就假手于人,而是堅定地、矢志不移地進行長期投入。究其根本,馬上消金所仰賴的生存密碼離不開三個字:自主性。
1
探路:堅定自研
金融賽道的大模型開發(fā)進程較想象中緩慢不少,原因有二。
首先,金融行業(yè)最重要的兩大特征:資金密集度高、風(fēng)險敏感度高。在經(jīng)濟大環(huán)境承壓的背景下,金融監(jiān)管對于合規(guī)經(jīng)營反復(fù)強調(diào),這讓金融行業(yè)的創(chuàng)新探索,步調(diào)格外謹(jǐn)慎。
其次,金融行業(yè)大模型探索面對的是復(fù)雜場景,科技巨頭們在一些垂直領(lǐng)域掌握的數(shù)據(jù)并不具備絕對優(yōu)勢,相較而言,在垂直行業(yè)的頭部機構(gòu)反而更有可能掌握著更加專精的數(shù)據(jù)和開發(fā)經(jīng)驗。
“天鏡”大模型在上線之前,已經(jīng)在營銷獲客、風(fēng)險審批、安全合規(guī)等零售金融典型場景落地。
馬上消費人工智能研究院高級研究員李寬告訴十字財經(jīng),馬上消費對大模型的價值定義主要聚焦在三個點:匯聚群體智能、喚醒沉睡知識和眾創(chuàng)數(shù)據(jù)價值。
“智能坐席服務(wù)目標(biāo)明確、場景清晰、工作量數(shù)據(jù)量也很大,是目前大模型運用最成熟、落地最深的應(yīng)用場景,也是最能體現(xiàn)‘匯聚群體智能’的服務(wù)領(lǐng)域。”李寬補充,“傳統(tǒng)的AI需要人工參與配流程、配話術(shù),大模型大在參數(shù)量和數(shù)據(jù)量,通過學(xué)習(xí)優(yōu)秀人工的對話數(shù)據(jù),在黑盒中完成訓(xùn)練,能夠用擬人化的自然語言隨機應(yīng)變地與客戶進行交流,話術(shù)不長,適配場景,客戶體驗很好。”
迄今為止,大模型實際投入運營已6個月,從目前累計的運行數(shù)據(jù)來看,“天鏡”大模型的意圖理解準(zhǔn)確率達91%,相較于傳統(tǒng)AI的68%有大幅提升;客戶參與度61%,也遠高于傳統(tǒng)模型43%的參與率,和人工坐席平均57%的水平。
從馬上消費的業(yè)務(wù)規(guī)模來看,基數(shù)已經(jīng)很大。最新數(shù)據(jù)顯示,馬上消費合作金融機構(gòu)超200個,合作商戶超100萬,其自主運營的APP“安逸花”,目前日活躍用戶超160萬人次。這意味著,在效能方面哪怕是提升個位數(shù)的百分比,也能帶來相當(dāng)大的社會效益。而效率的大幅提升為研發(fā)帶來了正向反饋,進一步推動大模型產(chǎn)品的后續(xù)打磨。
而李寬提及的“喚醒沉睡知識”和“眾創(chuàng)數(shù)據(jù)價值”則是馬上消費要進一步探索的方向所在。
根據(jù)李寬的介紹,所謂“喚醒沉睡知識”,主要是針對非結(jié)構(gòu)化的文檔,表現(xiàn)形式眾多,比如規(guī)章制度,技術(shù)方案,會議紀(jì)要,驗收報告,匯報材料等企業(yè)過往經(jīng)營形成的知識沉淀。“雖然現(xiàn)在企業(yè)基本上都做到了文檔的數(shù)字化,但仍然面臨著檢索不便、無法對有效知識充分利用的問題,‘天鏡’大模型就能夠很好地解決這些問題,把文檔給到大模型之后可以直接提問,獲得答案。”李寬表示。
眾創(chuàng)數(shù)據(jù)價值則是針對結(jié)構(gòu)化的數(shù)據(jù)庫表的利用和分析,當(dāng)下,企業(yè)的大量經(jīng)營行為都涉及數(shù)據(jù)分析工作,而結(jié)構(gòu)化的數(shù)據(jù)庫表需要數(shù)據(jù)分析人員手動生成SQL,‘天鏡’大模型上線后,數(shù)據(jù)分析人員只需用自然語言描述數(shù)據(jù)需求,大模型就能直接生成SQL和圖表,大大節(jié)省了數(shù)據(jù)分析人員的工作量,降低了數(shù)據(jù)使用門檻。
在馬上消費的“天境”大模型發(fā)布之后不久,螞蟻、騰訊云面向中小金融機構(gòu)陸續(xù)發(fā)布了開源金融大模型應(yīng)用。
事實上,對大多數(shù)中小金融機構(gòu)而言,要快速實現(xiàn)大模型應(yīng)用的落地,選擇開源大模型無疑是更具效率和性價比的方式。對這一點,馬上消費也十分清楚。
“相較而言,自研大模型無疑是一條更為艱難的道路。需要投入數(shù)倍于前者的時間、人力、財力,其中甚至有很多資源注定會被虛擲。”李寬表示,“開源大模型在使用階段也會面臨許多挑戰(zhàn),比如領(lǐng)域適配性、訓(xùn)練效率、推理速度等,而我們自研的大模型是在零售金融這個垂直領(lǐng)域做了專門的適配,用自有數(shù)據(jù)進行訓(xùn)練,擁有更專精的領(lǐng)域匹配能力,長期來看,也能為將來贏得更強的技術(shù)自主性,為公司的長遠發(fā)展構(gòu)筑更高的競爭壁壘。”
“自主性”不僅是過往8年發(fā)展歷程的總結(jié),也是未來征程的注腳。
沒有傘的孩子更要努力奔跑。因為明白這個道理,自2015年成立以來,馬上消費每年都在持續(xù)大手筆地進行技術(shù)研發(fā)投入,迄今為止,已累計投入33億元,申請發(fā)明專利超1500件,自主研發(fā)出1000多套系統(tǒng),研發(fā)團隊超2000人。這樣的投入規(guī)模和研發(fā)陣容在行業(yè)并不多見。
如今,大模型已經(jīng)是一個高端玩家的賽道,資金實力、數(shù)據(jù)沉淀、技術(shù)儲備缺一不可,高筑墻、廣積糧的好處已然呈現(xiàn)。
2
往何處去:安全合規(guī)、數(shù)據(jù)治理
金融大模型的構(gòu)建是一個系統(tǒng)化工程,需要以實際需求為驅(qū)動,逐層從基礎(chǔ)設(shè)施、模型算法,向場景化應(yīng)用、軟件開發(fā)修筑起一座大廈,而這座大廈的地基是安全合規(guī)。
對金融行業(yè)而言,安全合規(guī)是一切創(chuàng)新與探索的前提。馬上消費首席信息官蔣寧在大模型發(fā)布之際表示:“希望在任何情況下,它給客戶的回答都是合規(guī)的,并且在任何不可預(yù)期的情況下它的結(jié)果是穩(wěn)定的。”
這既是一個期望,也是一個任務(wù)。
馬上消費人工智能研究院創(chuàng)新研究部負責(zé)人馮月介紹稱,通常大模型安全是兩方面的,一方面是其生產(chǎn)內(nèi)容本身的安全性,另一方面是在金融行業(yè)安全合規(guī)上,大模型有什么進一步的賦能。
關(guān)于大模型本身的安全,由于大模型本身是生成式模型,其生成內(nèi)容天然帶有不確定性,因此本身就涉及合法合規(guī)問題,也即行業(yè)里常說的“內(nèi)容安全”問題,在技術(shù)領(lǐng)域里也稱為“價值觀對齊”問題。
對于這類問題,目前是雙管齊下,一是基層大模型本身在訓(xùn)練過程中就應(yīng)該使用價值觀正確的、內(nèi)容安全的訓(xùn)練語料,提供正直、善良而非邪惡的基座,這依賴于訓(xùn)練數(shù)據(jù)的篩選;二是應(yīng)用方應(yīng)在使用時級聯(lián)一套內(nèi)容安全算法,對結(jié)果進行涉黃、涉暴、涉政等常見違法內(nèi)容管控,在觸發(fā)時進行攔截,這依賴于管控算法本身的訓(xùn)練。
關(guān)于大模型的安全應(yīng)用,金融安全通常指的是合法、合規(guī)和經(jīng)營風(fēng)險規(guī)避三個部分。合法針對的普世的國家法律問題,這類問題在企業(yè)的表現(xiàn)可以是合同審核問題;合規(guī)針對的是專業(yè)的監(jiān)管機構(gòu)的規(guī)定、建議等問題,這類問題可能是信息化建設(shè)、隱私保護建設(shè)等問題;經(jīng)營風(fēng)險規(guī)避針對的是企業(yè)經(jīng)營本身所產(chǎn)生的結(jié)構(gòu)性風(fēng)險,這類問題在企業(yè)的表現(xiàn)可以是欺詐的發(fā)現(xiàn)、員工的行為管控、客戶的投訴咨詢等。
如果說上述方向是企業(yè)未來的發(fā)展命題,數(shù)據(jù)治理的未來則是值得整個行業(yè)探討的話題。
“中文數(shù)據(jù)的通用大模型的效果要差一些,寫高質(zhì)量的中文語料和相應(yīng)數(shù)據(jù)建設(shè)需要行業(yè)的共同努力,也需要時間。”馬上消費技術(shù)部專家表示,“此外,《個人信息保護法》出臺以后,對于數(shù)據(jù)的運營和流通,外部監(jiān)管和法律約束變得非常嚴(yán)格,大模型需要大量數(shù)據(jù)喂養(yǎng),更大發(fā)揮價值的話,一定要想辦法打通同行業(yè)甚至跨行業(yè)的數(shù)據(jù)壁壘。在數(shù)據(jù)治理方面,每個企業(yè)都有自己制度設(shè)計和管理方式。對于數(shù)據(jù)流通的探討從來沒有停止過。聯(lián)邦學(xué)習(xí)、隱私計算、數(shù)據(jù)的可用不可見都是很好的探索。這些是需要全行業(yè)共同努力的事情。”
科技的本質(zhì)是賦能,無論多么先進的技術(shù)手段,最終都必須落地到業(yè)務(wù)端形成正反饋,否則就毫無意義。
前途光明,道路崎嶇。但往往,人跡罕至的道路才能抵達最美的風(fēng)景。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。