近日,國家發(fā)改委等五部門(mén)發(fā)布《關(guān)于深入實(shí)施“東數西算”工程 加快構建全國一體化算力網(wǎng)的實(shí)施意見(jiàn)》,《實(shí)施意見(jiàn)》要求探索構建多源異構數據統一標識編碼體系,開(kāi)展跨地區跨行業(yè)多源數據標識互認,促進(jìn)數據流通體系與算力支撐體系協(xié)同運行。
構建數據統一標識編碼體系意義重大
數據統一標識編碼體系的重要意義是讓數據互通、流通。它是數據要素化的重要基礎設施之一,是多源異構數據能夠“通”起來(lái)的前提。由于數據具有來(lái)源不一、結構差異等特性,推動(dòng)數據流通必然需要統一的規則和標識。數據通過(guò)統一標識編碼體系進(jìn)行編碼后,數據的價(jià)值能通過(guò)標識編碼被外界看見(jiàn),數據的價(jià)值外顯;此外,數據還能實(shí)現兩個(gè)層面的互聯(lián)互通;一是通過(guò)數據的統一標識編碼,讓不同的數據在統一的規則規范下運行;二是打通數據地域行業(yè)產(chǎn)業(yè)上下游的壁壘,實(shí)現互聯(lián)互通,真正地讓數據流通起來(lái),釋放數據要素價(jià)值。
構建數據統一標識編碼體系的三大要點(diǎn)
作為基礎設施的數據統一標識編碼體系,在探索過(guò)程中需要注意三點(diǎn):一是根據數據流通需要,統一標識編碼體系既能跨地域、跨行業(yè)實(shí)現國內流通,也能與國際接軌,畢竟促進(jìn)數據有序跨境流動(dòng),對標國際高標準經(jīng)貿規則是《“數據要素×”三年行動(dòng)計劃(2024—2026年)》重要內容之一。二是數據統一標識編碼體系能夠充分體現數據的關(guān)鍵特征,確保其流通過(guò)程中的各個(gè)環(huán)節的重要元素被看見(jiàn)。包括數據涉及的地域性、行業(yè)性、分類(lèi)、分級、時(shí)效性、數據量、價(jià)值性等,如分級特征,通過(guò)分級的確定,直接確定該數據能否流通;時(shí)效性、數據量和價(jià)值性等特征是當前數據交易過(guò)程中的重要參考維度,甚至決定數據的價(jià)格。三是數據統一標識編碼體系需要區塊鏈、人工智能等技術(shù)作為支撐,做好數據標識編碼,同時(shí)自動(dòng)進(jìn)行識別,提高數據的識別及流通效率。
國內工業(yè)數據編碼體系及數據編碼體系探索
當前,在工業(yè)互聯(lián)網(wǎng)領(lǐng)域我國自主規劃設計和應用的標識編碼解析體系,能與VAA、Handle、OID、Ecode、GS1、MA等多種國際主流標識體系互聯(lián)互通,賦予產(chǎn)品唯一的“數字身份證”,通過(guò)背后的數據鏈及其他技術(shù)進(jìn)行編碼識別,實(shí)現數據的流通。在數據領(lǐng)域,人民數據探索打造了中國首個(gè)數據元素識別編碼體系,在與國際國內通用編碼機構合作的基礎上,人民數據取得數據領(lǐng)域第一個(gè)編碼號段代碼MA15602.data,并打造上線(xiàn)自主研發(fā)的數據元素識別體系。據了解,這一數據元素識別編碼體系可以讓數據價(jià)值真正被看見(jiàn),是對數據要素系統化的分級分類(lèi),從最小元素實(shí)現數據識別標注的最大社會(huì )化梳理,解決了數據描述、數據畫(huà)像、數據價(jià)值等關(guān)鍵問(wèn)題,清晰界定數據地域、行業(yè)、大小、時(shí)間、質(zhì)量等資源特征,形成唯一且能快速識別的數字身份,實(shí)現數據“持證流通”。
作者:人民數據研究院研究員 吳漢華