Moonshot AI發(fā)布首款自主強化學(xué)習(xí)Agent產(chǎn)品Kimi-Researcher,開啟灰度測試快訊
【TechWeb】Moonshot AI公司近日正式推出其首款A(yù)gent產(chǎn)品——Kimi-Researcher(深度研究),能夠獨立規(guī)劃任務(wù)流程并輸出完整的研究結(jié)果,Kimi-Researcher能夠自主判斷在信息沖突時的處理策略。
【TechWeb】Moonshot AI公司近日正式推出其首款A(yù)gent產(chǎn)品——Kimi-Researcher(深度研究),并且已經(jīng)開始進行小范圍的灰度測試。

Kimi-Researcher采用端到端自主強化學(xué)習(xí)(end-to-end agentic RL)技術(shù)構(gòu)建,在HLE測試中表現(xiàn)出色,其性能超過了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research等知名模型,與Gemini-Pro的Deep Research Agent性能相當(dāng)。
這款智能研究助手Kimi-Researcher具有高度的自主性,能夠獨立規(guī)劃任務(wù)流程并輸出完整的研究結(jié)果。它與其他Agent的最大不同點在于其零結(jié)構(gòu)設(shè)計,無需依賴復(fù)雜的提示詞或預(yù)設(shè)流程,完全依靠自主決策能力在動態(tài)環(huán)境中運作。
Kimi-Researcher能夠自主判斷在信息沖突時的處理策略,決定任務(wù)節(jié)點的轉(zhuǎn)換時機,以及篩選中間信息的重要性,始終以實際解決任務(wù)效果為核心驅(qū)動力。
作為一款專注于深度研究的模型,Kimi-Researcher整合了多個來源的數(shù)據(jù),并支持每條引用的直接追溯,這保證了研究的嚴謹性,并有效降低了幻覺問題的出現(xiàn)。Moonshot AI表示,未來將逐步開放Kimi-Researcher的基礎(chǔ)預(yù)訓(xùn)練模型及強化學(xué)習(xí)優(yōu)化版本的源代碼,以促進Agent強化學(xué)習(xí)領(lǐng)域的進一步探索和發(fā)展。(Suky)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。