本報太原3月13日訊(記者王蕾)3月11日,省數(shù)據(jù)局下發(fā)通知,為加快培育一批行業(yè)高質(zhì)量數(shù)據(jù)集,強(qiáng)化數(shù)據(jù)要素高效供給,樹立行業(yè)應(yīng)用標(biāo)桿,充分發(fā)揮示范引領(lǐng)作用,賦能我省數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展,組織開展行業(yè)高質(zhì)量數(shù)據(jù)集征集工作。
通知指出,征集領(lǐng)域主要面向但不限于科學(xué)研究、工業(yè)制造、農(nóng)業(yè)農(nóng)村、智慧能源、交通運(yùn)輸、金融服務(wù)、醫(yī)療衛(wèi)生、教育教學(xué)、商務(wù)領(lǐng)域、人力資源、文化旅游、應(yīng)急管理、氣象服務(wù)、綠色低碳、公共安全、城市治理等重點(diǎn)領(lǐng)域,以及低空經(jīng)濟(jì)、智慧駕駛、具身智能、生物制造等創(chuàng)新領(lǐng)域的高質(zhì)量數(shù)據(jù)集。
申報主體為在省內(nèi)注冊的獨(dú)立法人單位,包括政府部門、企事業(yè)單位、科研院所等。申報單位近3年經(jīng)營狀況良好,在信用、質(zhì)量、安全等方面無不良記錄。
行業(yè)高質(zhì)量數(shù)據(jù)集是指經(jīng)過系統(tǒng)化的采集、匯聚、清洗、標(biāo)注等全流程數(shù)據(jù)處理,可直接用于開發(fā)和訓(xùn)練人工智能模型,并能有效提升模型性能的行業(yè)數(shù)據(jù)集合。根據(jù)數(shù)據(jù)所蘊(yùn)含知識類型,可分為行業(yè)通識數(shù)據(jù)集和行業(yè)專識數(shù)據(jù)集。數(shù)據(jù)集可包含結(jié)構(gòu)化數(shù)據(jù)、文本、視頻、音頻、圖形圖像等多種模態(tài),數(shù)據(jù)規(guī)模原則上應(yīng)達(dá)到TB級。數(shù)據(jù)集應(yīng)為已建成或在建項目,具備實(shí)際業(yè)務(wù)應(yīng)用場景,并在技術(shù)先進(jìn)性、模式創(chuàng)新性、應(yīng)用示范性以及動態(tài)更新機(jī)制等方面表現(xiàn)突出。
(責(zé)任編輯:梁艷)