馬斯克旗下xAI今日中午發(fā)布Grok 3 消息稱具備自我糾正機(jī)制和強(qiáng)化學(xué)習(xí)能力快訊
xAI在訓(xùn)練Grok 3的合成數(shù)據(jù)集,xAI在訓(xùn)練Grok 3的過(guò)程中,減少了訓(xùn)練時(shí)間。
【TechWeb】2月18日消息,據(jù)外媒報(bào)道,xAI的領(lǐng)導(dǎo)者馬斯克當(dāng)?shù)貢r(shí)間周日已在社交媒體上表示,新一代的大語(yǔ)言模型Grok 3,將在太平洋時(shí)間周一晚8點(diǎn)發(fā)布,將是地球上最聰明的人工智能。

太平洋時(shí)間周一晚8點(diǎn),對(duì)應(yīng)的北京時(shí)間是周二中午12點(diǎn),這也就意味著xAI Grok 3的發(fā)布會(huì),在今日中午就將正式開(kāi)始。
隨著發(fā)布時(shí)間的臨近,外媒也在報(bào)道中給出了大量有關(guān)這一款大語(yǔ)言模型的更多信息,包括訓(xùn)練中提供的算力、訓(xùn)練的數(shù)據(jù)來(lái)源、具備的功能等。
在算力方面,有外媒在報(bào)道中xAI僅花費(fèi)8個(gè)月就建成的Colossus超級(jí)計(jì)算機(jī),加快了Grok 3的開(kāi)發(fā)速度,這一超級(jí)計(jì)算機(jī)由10萬(wàn)塊英偉達(dá)H100驅(qū)動(dòng),提供了2億GPU小時(shí)的訓(xùn)練時(shí)間,是Grok 2的10倍,算力的顯著提升幫助Grok 3更有效的處理大型數(shù)據(jù)集,減少了訓(xùn)練時(shí)間,并提高了準(zhǔn)確性。
除了大幅增加的算力,xAI在訓(xùn)練Grok 3的過(guò)程中,還調(diào)整了訓(xùn)練方法,以提高能力,也采用了合成數(shù)據(jù)集、自我糾正機(jī)制和強(qiáng)化學(xué)習(xí)來(lái)提高性能。
xAI在訓(xùn)練Grok 3的合成數(shù)據(jù)集,是由人工生成的數(shù)據(jù)集,不是從真實(shí)世界收集的數(shù)據(jù),他們通過(guò)模擬各種場(chǎng)景來(lái)訓(xùn)練人工智能模型,確保數(shù)據(jù)集的多樣性和受控,這有助于提高學(xué)習(xí)效率,并解決了數(shù)據(jù)隱私方面的擔(dān)憂。
自我糾正機(jī)制則是允許識(shí)別和糾正模型自身錯(cuò)誤的人工智能技術(shù),通過(guò)評(píng)估輸出并同已知的正確響應(yīng)進(jìn)行比較,模型可以隨著時(shí)間的推移改進(jìn)回應(yīng),減少錯(cuò)誤并提高準(zhǔn)確性。
強(qiáng)化學(xué)習(xí)使AI模型通過(guò)獎(jiǎng)勵(lì)或懲罰來(lái)學(xué)習(xí),可以通過(guò)試錯(cuò)來(lái)最大限度的提高決策能力。此外,外媒在報(bào)道中還提到,xAI引入了人工反饋循環(huán)和情境訓(xùn)練,以確保更自然和更準(zhǔn)確的反饋。(海藍(lán))
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為T(mén)MT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。