本報(bào)訊 (記者張文湘)3月18日,MiniMax(上海稀宇極智科技有限公司)發(fā)布新一代Agent旗艦大模型M2.7,首次展示“模型自我進(jìn)化”路徑。該模型通過(guò)構(gòu)建Agent Harness體系,深度參與自身訓(xùn)練與優(yōu)化流程,在部分研發(fā)場(chǎng)景中可承擔(dān)30%—50%的工作量,并在內(nèi)部評(píng)測(cè)集上實(shí)現(xiàn)約30%的效果提升。
據(jù)介紹,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成績(jī),接近國(guó)際一線水平;同時(shí)在VIBE-Pro、Terminal Bench2等真實(shí)工程測(cè)試中表現(xiàn)突出,支持端到端項(xiàng)目交付與復(fù)雜系統(tǒng)理解。辦公場(chǎng)景方面,其在GDPval-AA的ELO得分是1495,為開(kāi)源模型中最高,并顯著提升Office文檔處理與多輪編輯能力。
分析人士認(rèn)為,如果自我“進(jìn)化”能力進(jìn)一步成熟,未來(lái)AI系統(tǒng)有望實(shí)現(xiàn)從數(shù)據(jù)構(gòu)建、模型訓(xùn)練到評(píng)測(cè)優(yōu)化的全流程自動(dòng)化,這將顯著壓縮研發(fā)周期,并重塑AI產(chǎn)業(yè)的成本結(jié)構(gòu)與競(jìng)爭(zhēng)格局。M2.7的發(fā)布,意味著國(guó)內(nèi)廠商正在嘗試定義下一階段的技術(shù)路線,即以Agent為核心、以自我“進(jìn)化”為驅(qū)動(dòng)的AI系統(tǒng)。
(編輯 黃力)
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注