深圳數(shù)據(jù)交易所首發(fā)500個垂直行業(yè)多模態(tài)算料集
摘要: 近日,“數(shù).算.網(wǎng)”融合發(fā)展暨粵港澳大灣區(qū)(南山.前海)算力服務聯(lián)盟第一期交流研討會在南山區(qū)英特爾大灣區(qū)科技創(chuàng)新中心召開。本次研討會由南山區(qū)科技創(chuàng)新局和前海管理局政務數(shù)據(jù)處指導支持,
近日,“數(shù).算.網(wǎng)”融合發(fā)展暨粵港澳大灣區(qū)(南山.前海)算力服務聯(lián)盟第一期交流研討會在南山區(qū)英特爾大灣區(qū)科技創(chuàng)新中心召開。本次研討會由南山區(qū)科技創(chuàng)新局和前海管理局政務數(shù)據(jù)處指導支持,國家(深圳.前海)新型互聯(lián)網(wǎng)交換中心、深圳數(shù)據(jù)交易所、英特爾大灣區(qū)科技創(chuàng)新中心共同承辦,匯聚了政府主管領(lǐng)導、企業(yè)大咖和業(yè)界專家,圍繞粵港澳大灣區(qū)數(shù)據(jù)、算力、網(wǎng)絡產(chǎn)業(yè)鏈的深度合作與創(chuàng)新展開熱烈研討,旨在搭建資源共享、優(yōu)勢互補、技術(shù)轉(zhuǎn)化、應用創(chuàng)新的高端對話平臺,推動灣區(qū)數(shù)字經(jīng)濟邁向新高度,助力粵港澳大灣區(qū)人工智能訓練場建設(shè)。

會上,深圳數(shù)據(jù)交易所(以下簡稱深數(shù)所)發(fā)布了大模型訓練數(shù)據(jù)路線圖,并聯(lián)合開放算料聯(lián)盟發(fā)布500個垂直行業(yè)多模態(tài)算料集。深圳數(shù)據(jù)交易所人工智能行業(yè)主管王吳越進行了主旨發(fā)言,并展示了深數(shù)所助力粵港澳大灣區(qū)人工智能訓練場建設(shè)的行業(yè)實踐。
王吳越表示,在數(shù)字經(jīng)濟時代,“數(shù)據(jù)要素×”與“人工智能+”成為推動新質(zhì)生產(chǎn)力的雙輪驅(qū)動,共同引領(lǐng)著經(jīng)濟社會的進步與發(fā)展。數(shù)據(jù)作為一個高效的“乘法”因子,能夠與不同行業(yè)結(jié)合,顯著提升行業(yè)的生產(chǎn)效率或創(chuàng)新能力,而人工智能技術(shù)則通過“加法”方式為傳統(tǒng)產(chǎn)業(yè)帶來漸進式的改進和優(yōu)化,兩者相互交織,共同成為數(shù)字經(jīng)濟發(fā)展的雙翼。
王吳越介紹了以數(shù)據(jù)為中心的人工智能(Data-Centric AI)發(fā)展理念并發(fā)布了大模型訓練數(shù)據(jù)路線圖。深數(shù)所將按照大模型應用的不同階段(訓練、推理、調(diào)優(yōu)),有的放矢地提供數(shù)據(jù)源,使得國產(chǎn)大模型廠商“尋數(shù)有路”。
據(jù)介紹,目前,開放算料聯(lián)盟&開放群島大模型SIG在“數(shù)據(jù)要素×”與“人工智能+”雙輪驅(qū)動發(fā)展取得的成果:一是發(fā)布了粵港澳大灣區(qū)大模型訓練數(shù)據(jù)地圖;二是提供了端到端的跨模態(tài)數(shù)據(jù)挖掘開源工具;三是構(gòu)建了數(shù)據(jù)資源價值發(fā)現(xiàn)智能體。
隨后,深數(shù)所與開放算料聯(lián)盟聯(lián)合發(fā)布了由37家不同的數(shù)據(jù)商提供的,首批500個人工智能大模型高質(zhì)量訓練數(shù)據(jù)集,涵蓋12個“數(shù)據(jù)要素×”領(lǐng)域,3家境外數(shù)據(jù)商,7類數(shù)據(jù)模態(tài)(文本、圖像、音頻、視頻、多模態(tài)、3D、GIS等),本批數(shù)據(jù)集首次匯聚了來自中國氣象局、中國知網(wǎng)、中譯語通、萬邦同和、微夢數(shù)據(jù)(新浪微博)、前海數(shù)據(jù)、海天瑞聲、拓爾思(300229)、數(shù)據(jù)堂、智慧芽、網(wǎng)智天元、柏川數(shù)據(jù)、深信科技等數(shù)據(jù)商的數(shù)據(jù)集作為大模型算料。其中大部分算料為全國首發(fā)。
會上,深圳數(shù)據(jù)交易所公開了高質(zhì)量數(shù)據(jù)集的可信流通渠道,具體包括以下環(huán)節(jié):第一步,繪制大模型訓練數(shù)據(jù)資源地圖,為數(shù)據(jù)交易提供清晰的導航;第二步,數(shù)據(jù)商正式入駐深數(shù)所,由數(shù)據(jù)交易所提供堅實的平臺支持;第三步,數(shù)據(jù)商進行可信的質(zhì)量評測,確保數(shù)據(jù)的準確性和可靠性;第四步,合規(guī)審核與產(chǎn)品上市,為數(shù)據(jù)的安全流通提供保障;第五步,數(shù)據(jù)要素流通交易,實現(xiàn)數(shù)據(jù)的價值轉(zhuǎn)化。這一系列流程構(gòu)成了高質(zhì)量數(shù)據(jù)集從歸集到交易的完整可信路徑。
未來,深數(shù)所將充分發(fā)揮“雙區(qū)”驅(qū)動、“雙區(qū)”疊加、“雙改”示范效應,堅持創(chuàng)新引領(lǐng),為國產(chǎn)大模型廠商提供燃料,并攜手大模型廠商在數(shù)據(jù)要素×重點行動領(lǐng)域共建垂直行業(yè)大模型數(shù)據(jù)應用。
模型,人工智能






