青青草a国产免费观看|91麻豆精品国产福利|国产av五无码一级毛片|亚洲爆乳精品无码一区二区|久久亚洲AV成人无码国产|91无码人妻一区二区三区|色婷婷av一区二区三区性色|国产制服91一区二区三区制服,女人书籍排行榜,盗墓笔记小说txt下载,玄幻小说排行榜完本

上海AI企業(yè)發(fā)布全球首個(gè)混合架構(gòu)開源模型

2025-06-20 16:43:32 來(lái)源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù):

科技日?qǐng)?bào)記者 李均

低成本推理與超長(zhǎng)文本理解的創(chuàng)新之門,近日被我國(guó)一家AI企業(yè)敲開。連日來(lái),這一科技創(chuàng)新事件在全球AI領(lǐng)域引發(fā)震動(dòng)。

6月17日凌晨,總部位于上海的AI獨(dú)角獸企業(yè)MiniMax(上海稀宇科技有限公司),發(fā)布了自主研發(fā)的“全球首個(gè)開源的大規(guī)?;旌霞軜?gòu)推理模型”MiniMax-M1(以下簡(jiǎn)稱M1)。M1支持100萬(wàn)token上下文窗口,訓(xùn)練成本僅為53.74萬(wàn)美元,約合380萬(wàn)元人民幣,其長(zhǎng)文本處理、寫代碼等核心性能填補(bǔ)了開源領(lǐng)域長(zhǎng)上下文技術(shù)的空白,展現(xiàn)比肩甚至超越業(yè)界頂尖模型的實(shí)力。

開源“新王”:較低成本訓(xùn)練出頂尖模型

當(dāng)前,AI發(fā)展迎來(lái)關(guān)鍵轉(zhuǎn)折點(diǎn),如同一場(chǎng)比賽進(jìn)入下半場(chǎng)。大模型的競(jìng)爭(zhēng)已經(jīng)轉(zhuǎn)變?yōu)樗懔?、?shù)據(jù)、應(yīng)用場(chǎng)景等整個(gè)生態(tài)的競(jìng)爭(zhēng),而高效、低成本、強(qiáng)推理能力成為定義下一代AI創(chuàng)新的關(guān)鍵變量?!癕1如同用經(jīng)濟(jì)型轎車的成本造出了豪華超跑?!薄癕1是我們眼中的性價(jià)比‘新王’?!被ヂ?lián)網(wǎng)上,一些AI行業(yè)觀察者給出這樣的評(píng)價(jià)。

作為國(guó)內(nèi)“AI六小虎”之一的MiniMax,此次發(fā)布的M1大模型擁有巨大的成本優(yōu)勢(shì),主要源于兩大技術(shù)創(chuàng)新。一是采用閃電注意力機(jī)制為主的混合架構(gòu),使得模型在計(jì)算長(zhǎng)的上下文輸入以及深度推理時(shí)更加高效;二是運(yùn)用CISPO強(qiáng)化學(xué)習(xí)算法,優(yōu)化重要性采樣權(quán)重,訓(xùn)練效率超越其他大模型。得益于CISPO的高效,M1模型的整個(gè)強(qiáng)化學(xué)習(xí)階段僅使用了512塊英偉達(dá)H800 GPU,耗時(shí)3周,成本僅為53.74萬(wàn)美元。MiniMax方面表示,這一成本“比最初的預(yù)期少了一個(gè)數(shù)量級(jí)”。

相關(guān)技術(shù)報(bào)告也指出,在進(jìn)行8萬(wàn)Token的深度推理時(shí),M1所需的算力僅為國(guó)內(nèi)另一款大模型的約30%;生成10萬(wàn)token時(shí),推理算力只需要另一款大模型的25%,實(shí)現(xiàn)了“性能躍升、成本腰斬”的雙重突破,為市場(chǎng)提供了一個(gè)高性能、低門檻的新選擇。對(duì)此,資深人工智能專家、高級(jí)工程師丁成剛認(rèn)為,MiniMax宣布在其自有的App和Web端,M1模型將保持不限量免費(fèi)使用。當(dāng)較低成本訓(xùn)練出頂尖模型,用戶不用擔(dān)心百萬(wàn)token上下文成為高昂服務(wù),可以預(yù)見,M1或?qū)?huì)成為智能體時(shí)代的首選開源基座模型。

技術(shù)“大考”:推動(dòng)架構(gòu)創(chuàng)新,實(shí)現(xiàn)性能超越

行業(yè)觀察人士認(rèn)為,面對(duì)多個(gè)核心生產(chǎn)力場(chǎng)景,M1于同類模型中率先實(shí)現(xiàn)了技術(shù)突破與架構(gòu)創(chuàng)新,它的核心競(jìng)爭(zhēng)力在于,將線性注意力(Linear Attention)與標(biāo)準(zhǔn)Softmax注意力有機(jī)融合,形成獨(dú)特的“閃電注意力”機(jī)制。這一設(shè)計(jì)讓M1在保持長(zhǎng)序列處理效率的同時(shí),解決了純線性注意力在信息檢索上的固有缺陷。

相關(guān)技術(shù)報(bào)告顯示,在性能方面,MiniMax在業(yè)內(nèi)公認(rèn)的17個(gè)主流評(píng)測(cè)集上對(duì)M1進(jìn)行了“檢閱”。結(jié)果顯示,M1表現(xiàn)亮眼,全面碾壓開源界。尤其是在軟件工程、長(zhǎng)上下文理解以及工具使用等復(fù)雜且對(duì)生產(chǎn)力要求較高的場(chǎng)景中,M1展現(xiàn)出絕對(duì)實(shí)力。在SWE-bench基準(zhǔn)測(cè)試?yán)?,M1-40k和M1-80k分別取得55.6%和56.0%的高分。憑借其百萬(wàn)級(jí)的上下文窗口,M1在長(zhǎng)上下文理解任務(wù)中具有壓倒性優(yōu)勢(shì),不僅超越所有開源模型,還在部分指標(biāo)上接近OpenAI o3和Claude4Opus,在全球范圍內(nèi)位居第二。

在代理工具使用場(chǎng)景(TAU-bench)的評(píng)測(cè)中,M1不僅在所有開源模型中脫穎而出,還戰(zhàn)勝了Gemini-2.5Pro。此外,M1-80k在多數(shù)基準(zhǔn)測(cè)試中的表現(xiàn)都優(yōu)于M1-40k,表明增加計(jì)算資源對(duì)于提升模型性能有顯著作用。在處理400頁(yè)技術(shù)文檔或10萬(wàn)行代碼庫(kù)時(shí),傳統(tǒng)模型需反復(fù)切分上下文,而M1可以做到整體消化、連貫推理,為智能體發(fā)展提供了開創(chuàng)性范例。

“M1打破了‘算力+資本’的競(jìng)爭(zhēng)模式,將對(duì)全球AI大模型市場(chǎng)產(chǎn)生深遠(yuǎn)影響。不過(guò),對(duì)于更多AI領(lǐng)域企業(yè)來(lái)說(shuō),要從技術(shù)流派轉(zhuǎn)向市場(chǎng)應(yīng)用,以解決問(wèn)題、實(shí)現(xiàn)任務(wù)為出發(fā)點(diǎn),開拓醫(yī)療、健康、旅游、傳媒等領(lǐng)域垂直類應(yīng)用場(chǎng)景,才能在AI的規(guī)?;瘧?yīng)用方面擁有更多想象空間和發(fā)展機(jī)遇?!辟Y深創(chuàng)投專家、江蘇投資人中心秘書長(zhǎng)吳峰認(rèn)為。

責(zé)任編輯:王倩

抱歉,您使用的瀏覽器版本過(guò)低或開啟了瀏覽器兼容模式,這會(huì)影響您正常瀏覽本網(wǎng)頁(yè)

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí),繼續(xù)瀏覽

繼續(xù)瀏覽
武安市| 白山市| 中方县| 遂平县| 景德镇市| 安新县| 葵青区| 临湘市| 东城区| 东安县| 宝鸡市| 饶河县| 华亭县| 道真| 高碑店市| 石柱| 福海县| 靖远县| 芦山县| 海城市| 合作市| 信阳市| 乌拉特前旗| 垣曲县| 蓝山县| 云阳县| 嘉黎县| 云林县| 精河县| 丹凤县| 日喀则市| 澜沧| 麻栗坡县| 徐州市| 凉城县| 盐津县| 宁德市| 岐山县| 凉山| 清河县| 黄大仙区|