科技日?qǐng)?bào)記者 張佳欣
近期,外媒紛紛將聚光燈投向中國初創(chuàng)企業(yè)深度求索公司,其自主研發(fā)的人工智能(AI)大語言模型“深度求索”(DeepSeek)憑借“好用、開源、免費(fèi)”三大特點(diǎn),在全球范圍內(nèi)引發(fā)熱烈反響。這一創(chuàng)新成果不僅在中國本土大放異彩,更是在大洋彼岸的美國乃至全球科技界激起了廣泛討論并受到高度評(píng)價(jià),被視為挑戰(zhàn)現(xiàn)有AI巨頭壟斷地位的“一股清流”。
多家外媒接連不斷的報(bào)道,讓DeepSeek這一出人意料的、高效而強(qiáng)大的AI模型席卷了科技行業(yè),這種“改變游戲規(guī)則”的大型語言模型,有望快速重塑AI格局。
低成本兼具高性能
西班牙《國家報(bào)》、澳大利亞《對(duì)話》雜志、美國《紐約時(shí)報(bào)》等多家外媒均關(guān)注到,DeepSeek的技術(shù)具有強(qiáng)大創(chuàng)新力,是因?yàn)樗茉诮档陀?jì)算成本的同時(shí)實(shí)現(xiàn)尖端性能。
AI公司通常使用裝有1.6萬枚或更多專用芯片的超級(jí)計(jì)算機(jī)來訓(xùn)練聊天機(jī)器人,但深度求索公司表示,他們只用了大約2000枚芯片。同時(shí),他們僅花了不到600萬美元就訓(xùn)練了新模型,成功在兩方面把構(gòu)建AI的價(jià)格“打了下來”。
首先,DeepSeek模型使用數(shù)據(jù)蒸餾技術(shù)生成高質(zhì)量數(shù)據(jù),提升了訓(xùn)練效率;其次,DeepSeek采用了一種稱為“混合專家”的方法。當(dāng)用戶提出一個(gè)問題時(shí),模型會(huì)決定是否激活其醫(yī)療專家、翻譯、律師或物理學(xué)家。傳統(tǒng)模型會(huì)同時(shí)激活所有專家,這會(huì)浪費(fèi)能源和計(jì)算能力。而DeepSeek則將這些小型“專家”系統(tǒng)與一個(gè)“通才”系統(tǒng)相結(jié)合,實(shí)現(xiàn)了相同的功能。通才系統(tǒng)對(duì)每個(gè)主題都有相當(dāng)?shù)牧私?,可幫助協(xié)調(diào)專家之間的互動(dòng)。
開源策略打破技術(shù)壟斷
Deepseek的獨(dú)特之處還在于,其采取了開源策略。這猶如在美國及少數(shù)幾個(gè)長期主導(dǎo)AI技術(shù)領(lǐng)域的巨頭中投了一枚震撼彈,打破了既有格局。
如今,這項(xiàng)技術(shù)已向全世界敞開大門。鑒于DeepSeek模型免費(fèi)可得,其他公司或?qū)⒉坏貌徽{(diào)整價(jià)格策略,以保持市場地位。當(dāng)能夠以零成本獲得類似技術(shù)時(shí),沒有人愿意支付額外費(fèi)用。
《對(duì)話》雜志報(bào)道稱,與專有AI模型占主導(dǎo)地位的美國不同,中國AI新創(chuàng)企業(yè)擁抱開源生態(tài)系統(tǒng),以更快地?cái)U(kuò)大創(chuàng)新規(guī)模,并融入全球AI合作。
得益于人才培養(yǎng)與政策支持
在近日的法國人工智能峰會(huì)上,多名國際科技界高管均認(rèn)為,DeepSeek 的出現(xiàn)表明,在AI領(lǐng)域,中國企業(yè)的進(jìn)步不容小覷。
《自然》雜志報(bào)道,2017年,中國政府宣布,計(jì)劃到2030年將中國打造成為全球AI領(lǐng)域的領(lǐng)頭羊。政府要求相關(guān)行業(yè)在2025年前實(shí)現(xiàn)AI領(lǐng)域的重大突破,“使相關(guān)技術(shù)和應(yīng)用達(dá)到世界領(lǐng)先水平”。
據(jù)美國喬治城大學(xué)安全與新興技術(shù)中心的一份報(bào)告,截至2022年,中國教育部已批準(zhǔn)440所大學(xué)開設(shè)AI專業(yè)本科學(xué)位。美國智庫MacroPolo數(shù)據(jù)顯示,同年,在全球頂尖AI研究人員中,華人幾乎占據(jù)了“半壁江山”,而美國人僅占18%。
澳大利亞悉尼科技大學(xué)科技政策研究員馬麗娜·張專注于中國的創(chuàng)新研究。她表示,DeepSeek公司的成功得益于政府對(duì)AI教育和人才培養(yǎng)的投資,這些投資包括眾多獎(jiǎng)學(xué)金、研究經(jīng)費(fèi)以及學(xué)術(shù)界與產(chǎn)業(yè)界的合作。
創(chuàng)新重塑全球AI格局
美國趣味工程網(wǎng)AI專欄作家塞賈爾·夏爾馬發(fā)表評(píng)論稱,如此強(qiáng)大的模型出自中國,讓美國感到“坐立不安”。英國廣播公司則直接在標(biāo)題中稱,“中國的DeepSeek AI震撼行業(yè),削弱美國霸權(quán)”。
美國總統(tǒng)特朗普當(dāng)?shù)貢r(shí)間1月27日在佛羅里達(dá)州邁阿密發(fā)表講話時(shí),稱DeepSeek的出現(xiàn)“給美國科技產(chǎn)業(yè)敲響了警鐘”。
美國《麻省理工技術(shù)評(píng)論》網(wǎng)站在報(bào)道中表示,考慮到中國AI企業(yè)面臨美國對(duì)尖端芯片出口管制日益收緊的制約,DeepSeek的成功“更顯非凡”。種種跡象表明,美國的制裁并未削弱中國的AI實(shí)力,反而似乎正驅(qū)使深度求索等初創(chuàng)企業(yè)以效率、資源整合和協(xié)作為優(yōu)先方向進(jìn)行創(chuàng)新。《國家報(bào)》報(bào)道也認(rèn)為,美國制裁加速了中國AI創(chuàng)新。
美國消費(fèi)者新聞與商業(yè)頻道網(wǎng)站援引專家觀點(diǎn)表示,美國自認(rèn)為處于世界科技領(lǐng)袖的地位已不再被普遍接受。