新華社記者 嚴(yán)賦憬
記者20日從國(guó)家數(shù)據(jù)局了解到,我國(guó)七個(gè)數(shù)據(jù)標(biāo)注基地?cái)?shù)據(jù)標(biāo)注規(guī)模再創(chuàng)新高,數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,相當(dāng)于中國(guó)國(guó)家圖書(shū)館數(shù)字資源總量的6倍左右。
數(shù)據(jù)標(biāo)注是對(duì)數(shù)據(jù)進(jìn)行添加標(biāo)記、說(shuō)明、解釋、分類(lèi)和編碼的過(guò)程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國(guó)七個(gè)數(shù)據(jù)標(biāo)注基地分別位于四川成都、遼寧沈陽(yáng)、安徽合肥、湖南長(zhǎng)沙、海南??凇⒑颖北6ê蜕轿鞔笸?,目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè);賦能121個(gè)國(guó)產(chǎn)人工智能大模型研發(fā);引進(jìn)和培育標(biāo)注企業(yè)223家;標(biāo)注從業(yè)人員達(dá)5.8萬(wàn)人;帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過(guò)83億元。
國(guó)家數(shù)據(jù)局有關(guān)負(fù)責(zé)人表示,未來(lái)將進(jìn)一步暢通數(shù)據(jù)采集、標(biāo)注、人工智能應(yīng)用產(chǎn)業(yè)鏈,重點(diǎn)推動(dòng)工業(yè)、金融、醫(yī)療、交通、教育等幾大領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展。