科技日報記者 都芃
“請問您用DeepSeek嗎?”
“我用,我本身專業(yè)是計算機專業(yè),我對人工智能有偏愛?!痹?月4日舉行的十四屆全國人大三次會議的新聞發(fā)布會后,大會發(fā)言人婁勤儉面對現(xiàn)場記者采訪時的這句回應火了。
今年春節(jié)期間,國產(chǎn)大模型DeepSeek憑借低成本、高效能、強智能的應用體驗給人們留下了深刻印象。今年的全國兩會上,“國產(chǎn)大模型”“DeepSeek”也是被許多代表委員反復提及的高頻詞。
近年來,隨著我國人工智能大模型產(chǎn)業(yè)加速發(fā)展,越來越多的國產(chǎn)大模型表現(xiàn)驚艷。作為數(shù)字化時代的核心驅動力,人工智能正加速滲透進入國民經(jīng)濟的多個領域。在不斷向上突破性能天花板的同時,國產(chǎn)大模型應如何扎根產(chǎn)業(yè)實踐,為產(chǎn)業(yè)升級賦能,成為代表委員們熱議的話題。
垂直模型扎根產(chǎn)業(yè)土壤
有問必答的快速響應、清晰明了的思考過程、全面翔實的參考資料……通過通用大模型,許多人開啟了與人工智能的第一次“親密接觸”。作為人工智能領域的重要突破,通用大模型具備強大的語言理解和生成能力,能夠為多個領域提供智能支撐。
隨著我國產(chǎn)業(yè)數(shù)字化進程不斷加速,各行業(yè)對人工智能的需求也愈發(fā)精細化、專業(yè)化。傳統(tǒng)的通用大模型在落地產(chǎn)業(yè)場景時,往往無法與具體業(yè)務精準結合,導致“水土不服”。在此背景下,專為產(chǎn)業(yè)細分需求打造的垂直模型應運而生,成為大模型技術落地產(chǎn)業(yè)應用的新趨勢。
“我們做大模型第一天就確定了‘1+N’的戰(zhàn)略路徑,即‘1個底座大模型+N個行業(yè)大模型’。我們結合通用底座、工具鏈和知識工程,擁有了‘建算力、理數(shù)據(jù)、訓模型、落場景、保安全、精運營’的全套解決方案?!笨拼笥嶏w股份有限公司董事長劉慶峰代表認為,通用大模型底座的天花板正被不斷打破,應用場景落地已進入紅利兌現(xiàn)期,需要以更少成本、更低算力、更高效率推動落地。
例如,借助阿里通義等通用大模型的底座能力,釘釘面向業(yè)務場景打造出AI助理產(chǎn)品,覆蓋制造、醫(yī)療、零售、教育等多個行業(yè)。在金石機器人常州股份有限公司,通過學習、沉淀大量機器人專業(yè)知識,釘釘AI助理直接服務全國1000余家經(jīng)銷商,高效解答各類產(chǎn)品售后問題;同時,它還可以根據(jù)問題描述,一鍵生成工單,并指派給對應負責人,將售后問題的解決時間從半個月縮短至3天內,顯著提升了企業(yè)運行效率。
“大模型在垂直領域大有可為。”360集團創(chuàng)始人周鴻祎委員表示,中國大模型發(fā)展的重要方向應該是借助產(chǎn)業(yè)和場景優(yōu)勢,將大模型與業(yè)務流程、產(chǎn)品功能相結合,尋求多場景應用,實現(xiàn)垂直化和產(chǎn)業(yè)化落地。
加快形成“數(shù)據(jù)飛輪”效應
我國擁有聯(lián)合國產(chǎn)業(yè)分類中的全部工業(yè)門類。在500個工業(yè)品種中,有四成以上產(chǎn)品產(chǎn)量位居全球第一,產(chǎn)業(yè)具有全、多、大的獨特優(yōu)勢。龐大的產(chǎn)業(yè)規(guī)模為行業(yè)垂直大模型落地提供了肥沃土壤,同時也帶來了風險挑戰(zhàn)。
產(chǎn)業(yè)數(shù)據(jù)是垂直大模型的“養(yǎng)料”。我國產(chǎn)業(yè)種類豐富,但也造成產(chǎn)業(yè)數(shù)據(jù)類型和結構多樣、數(shù)據(jù)質量參差不齊等難題。談及大模型落地產(chǎn)業(yè)應用,多位代表委員提及,應推動產(chǎn)業(yè)數(shù)據(jù)共享,加快高質量數(shù)據(jù)收集利用,在產(chǎn)業(yè)領域形成“數(shù)據(jù)飛輪”效應,即通過數(shù)據(jù)的不斷積累和利用,驅動大模型性能持續(xù)提升。
中國電氣裝備集團有限公司科技創(chuàng)新部部長張帆代表認為,許多制造企業(yè)數(shù)字化轉型起步晚、基礎薄弱,生產(chǎn)過程中的數(shù)據(jù)采集不全面、不及時;工業(yè)數(shù)據(jù)又往往存在噪聲大、格式不統(tǒng)一、關聯(lián)性差等問題,缺乏行業(yè)數(shù)據(jù)標準引導,難以為大模型訓練提供足夠的高質量數(shù)據(jù)。同時,受限于數(shù)據(jù)安全風險、商業(yè)利益保護等因素,企業(yè)間筑起了高高的“數(shù)據(jù)圍墻”,數(shù)據(jù)共享存在瓶頸。
基于此,張帆建議,應加快形成工業(yè)領域統(tǒng)一的人工智能數(shù)據(jù)格式規(guī)范和具體行業(yè)標準等,促使企業(yè)間對數(shù)據(jù)資產(chǎn)的交易基礎達成共識;龍頭企業(yè)要發(fā)揮鏈長作用,面向戰(zhàn)略性高價值場景,建立需求牽引、格式統(tǒng)一的高質量工業(yè)數(shù)據(jù)集。
圍繞大模型產(chǎn)業(yè)落地中的數(shù)據(jù)瓶頸,多地已開始行動。例如,北京市發(fā)布的《北京市推動“人工智能+”行動計劃(2024—2025年)》中提出,依托北京數(shù)據(jù)基礎制度先行區(qū),打造安全可信數(shù)據(jù)空間,引導企事業(yè)單位開放并匯聚高價值行業(yè)數(shù)據(jù)。