本報(bào)北京3月19日電 (記者王云杉)記者從國(guó)家數(shù)據(jù)局獲悉:我國(guó)7個(gè)數(shù)據(jù)標(biāo)注基地?cái)?shù)據(jù)標(biāo)注規(guī)模再創(chuàng)新高,總規(guī)模達(dá)到17282TB,相當(dāng)于中國(guó)國(guó)家圖書館數(shù)字資源總量的6倍左右。
數(shù)據(jù)標(biāo)注是對(duì)數(shù)據(jù)進(jìn)行添加標(biāo)記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國(guó)7個(gè)數(shù)據(jù)標(biāo)注基地分別位于四川成都、遼寧沈陽(yáng)、安徽合肥、湖南長(zhǎng)沙、海南海口、河北保定和山西大同,目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè);賦能121個(gè)國(guó)產(chǎn)人工智能大模型研發(fā);引進(jìn)和培育標(biāo)注企業(yè)223家;標(biāo)注從業(yè)人員達(dá)5.8萬人;帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過83億元。
《 人民日?qǐng)?bào) 》( 2025年03月20日 13 版)