以主流價(jià)值語(yǔ)料庫與人民智媒大模型為核心,構建內容創(chuàng )作、審校、問(wèn)答與智能體開(kāi)放的全鏈路 AI 應用體系。
總體規模
基礎語(yǔ)料
問(wèn)答語(yǔ)料
圖文語(yǔ)料
針對大模型面臨的瓶頸問(wèn)題,人民網(wǎng)全員下足“笨功夫”,人工設問(wèn)、人工作答、三審三校。結合大模型、自然語(yǔ)言處理等多種前沿技術(shù)歸集、清洗、標注、風(fēng)控,以“笨功夫”“巧功夫”的有機結合推動(dòng)高質(zhì)量語(yǔ)料的高效建設。
依托傳播內容認知全國重點(diǎn)實(shí)驗室的技術(shù)、算力與數據資源,研究基于大模型與專(zhuān)有模型的語(yǔ)料數據自動(dòng)分類(lèi)、精細標注與體系化技術(shù),搭建面向主流價(jià)值語(yǔ)料處理的全棧式語(yǔ)料處理工具鏈和可控共享服務(wù)平臺。
凝練新聞、政策、著(zhù)作、流行語(yǔ)等素材規律,構建適配多領(lǐng)域的專(zhuān)業(yè)語(yǔ)料庫和語(yǔ)料生成大模型,結合人工經(jīng)驗對輸出內容進(jìn)行多維度糾偏提質(zhì)。