日前,由DataCastle數(shù)據(jù)城堡聯(lián)合深圳國(guó)家基因庫(kù)、福建省數(shù)據(jù)治理與數(shù)據(jù)流通工程研究院、電子科技大學(xué)大數(shù)據(jù)研究中心、山東省數(shù)據(jù)要素創(chuàng)新創(chuàng)業(yè)共同體、亞馬遜云科技、移動(dòng)云編寫(xiě)的《人工智能與數(shù)據(jù)科學(xué)競(jìng)賽白皮書(shū)2022》于5月19日正式發(fā)布。 《白皮書(shū)2022》基于2020-2022年三年來(lái)國(guó)內(nèi)辦賽情況,聚焦政府、企業(yè)、科研機(jī)構(gòu)各類(lèi)賽事差異化發(fā)展、拆解競(jìng)賽基本架構(gòu)、分析競(jìng)賽業(yè)態(tài)的發(fā)展困境、研判人工智能與數(shù)據(jù)科學(xué)競(jìng)賽未來(lái)趨勢(shì)和發(fā)展方向。 《白皮書(shū)2022》聚焦近三年人工智能與數(shù)據(jù)科學(xué)競(jìng)賽現(xiàn)狀,通過(guò)抽樣調(diào)查、訪談、樣本分析等研究方法,積極探索人工智能與數(shù)據(jù)科學(xué)競(jìng)賽的價(jià)值路徑和發(fā)展方向,為眾多企事業(yè)單位數(shù)字化轉(zhuǎn)型瓶頸提供先決預(yù)見(jiàn),為拓展數(shù)據(jù)應(yīng)用方式、推動(dòng)數(shù)據(jù)要素流通應(yīng)用、尋找優(yōu)秀數(shù)據(jù)人才提供創(chuàng)新思路。 下本文為概覽: 1.人工智能與數(shù)據(jù)科學(xué)競(jìng)賽概述及基本價(jià)值 1.1概述: 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽是一種以競(jìng)賽為形式的數(shù)據(jù)應(yīng)用模式,在短時(shí)間內(nèi)聚集大量數(shù)字人才,通過(guò)合理的賽事設(shè)計(jì)促進(jìn)人工智能應(yīng)用開(kāi)發(fā)和數(shù)據(jù)要素的價(jià)值挖掘。
1.2基本價(jià)值: 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽作為一種創(chuàng)新業(yè)態(tài),對(duì)內(nèi)匯聚產(chǎn)學(xué)研用多方資源,對(duì)外影響、助力整個(gè)產(chǎn)業(yè)生態(tài)。在數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)中,政府、企業(yè)、技術(shù)人才、競(jìng)賽機(jī)構(gòu)形成了一個(gè)良性循環(huán)的子系統(tǒng), 創(chuàng)新系統(tǒng)內(nèi)數(shù)據(jù)要素、人才要素流通機(jī)制, 賦能數(shù)據(jù)科學(xué)產(chǎn)業(yè)發(fā)展。
2.發(fā)展情況與趨勢(shì)洞察 2.1各類(lèi)賽事差異化發(fā)展 2.1.1政府賽事-聚焦公共事業(yè)與行業(yè)應(yīng)用,數(shù)字孿生賦能智慧城市建設(shè) 近年來(lái)數(shù)據(jù)科學(xué)賽事市場(chǎng)中專(zhuān)項(xiàng)賽事比例逐漸增加,但在政府辦賽中,綜合賽事仍是主流。同時(shí),數(shù)字經(jīng)濟(jì)發(fā)展和智慧城市建設(shè)成為多地政府部門(mén)的重點(diǎn)工作,以數(shù)字孿生為代表的人工智能技術(shù)在智慧城市建設(shè)中發(fā)揮著積極作用。 2.1.2 企業(yè)賽事-探索競(jìng)賽與社區(qū)深度融合,構(gòu)建活躍用戶(hù)生態(tài) 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽作為技術(shù)社區(qū)的重要組成部分,被大型技術(shù)企業(yè)作為社區(qū)引流、用戶(hù)留存的重要手段,同時(shí)通過(guò)競(jìng)賽提升社區(qū)用戶(hù)參與度,提高用戶(hù)粘性和社區(qū)技術(shù)濃度。 2.1.3 科研類(lèi)賽事-獨(dú)立性減弱,嘗試綁定政企賽事 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽誕生于學(xué)術(shù)會(huì)議,在出現(xiàn)之初長(zhǎng)期作為學(xué)術(shù)研究活動(dòng)存在,但近年來(lái)學(xué)術(shù)機(jī)構(gòu)獨(dú)立辦賽比例持續(xù)下降,與政府、企業(yè)合作辦賽逐漸成為科研學(xué)術(shù)機(jī)構(gòu)辦賽的主要選擇。 2.2賽題趨勢(shì) 2.2.1 計(jì)算機(jī)視覺(jué)(CV)賽題是2022年最大熱門(mén) 在2022年統(tǒng)計(jì)到的635道賽題中,計(jì)算機(jī)視覺(jué)(以下統(tǒng)稱(chēng)CV)相關(guān)賽題占比36.5%,達(dá)232道,是占比最大的技術(shù)方向。
2.2.2 工業(yè)類(lèi)賽事聚焦應(yīng)用落地 自2021年起,工業(yè)類(lèi)人工智能與數(shù)據(jù)科學(xué)競(jìng)賽逐年增多。在2022年的12場(chǎng)工業(yè)類(lèi)賽事中,全部算法賽賽題均圍繞工業(yè)生產(chǎn)中的實(shí)際問(wèn)題進(jìn)行設(shè)計(jì),賽題難度適中,賽題方案易落地。 伴隨工業(yè)互聯(lián)網(wǎng)的普及應(yīng)用以及傳統(tǒng)工業(yè)制造業(yè)數(shù)字化轉(zhuǎn)型的趨勢(shì),工業(yè)制造企業(yè)開(kāi)始重視對(duì)工業(yè)數(shù)據(jù)的全面深度感知、實(shí)時(shí)傳輸交換、快速計(jì)算處理和高級(jí)建模分析,實(shí)現(xiàn)智能控制、運(yùn)營(yíng)優(yōu)化和生產(chǎn)組織方式變革。
3.賽事主體 3.1主辦方 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽的主辦方可以分為三大類(lèi) :政府、企業(yè)與科研機(jī)構(gòu)。 在2022年統(tǒng)計(jì)到的211場(chǎng)競(jìng)賽中,企業(yè)辦賽占據(jù)主流,共計(jì)109場(chǎng),占比51.7% ;政府辦賽數(shù)量多于科研機(jī)構(gòu)辦賽,共計(jì)64場(chǎng),占比30.3%;科研機(jī)構(gòu)(包含高校)辦賽38場(chǎng),占比18%。 政府 政府辦賽雖然只占據(jù)2022年人工智能與數(shù)據(jù)科學(xué)競(jìng)賽總場(chǎng)次的37%,但在整體競(jìng)賽生態(tài)中具有較大影響力。 政府辦賽現(xiàn)狀分析與趨勢(shì)預(yù)測(cè): ·探索公共數(shù)據(jù)應(yīng)用,推動(dòng)創(chuàng)新項(xiàng)目孵化 ·賽事水準(zhǔn)保持高位,賽事吸引力強(qiáng) ·政務(wù)數(shù)據(jù)為主,多種類(lèi)數(shù)據(jù)輔助 ·能夠提供優(yōu)質(zhì)稀缺數(shù)據(jù)、優(yōu)質(zhì)的技術(shù)證明、對(duì)高水平團(tuán)隊(duì)具有較高吸引力 企業(yè) 數(shù)據(jù)驅(qū)動(dòng)是企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的核心方式,人工智能與數(shù)據(jù)科學(xué)競(jìng)賽可以彌補(bǔ)企業(yè)在數(shù)字化轉(zhuǎn)型過(guò)程中數(shù)據(jù)應(yīng)用環(huán)節(jié)人力、時(shí)間、成本等方面的不足,部分競(jìng)賽賽題深入到數(shù)據(jù)處理環(huán)節(jié),探索復(fù)雜數(shù)據(jù)處理的新方法。 企業(yè)辦賽現(xiàn)狀分析與趨勢(shì)預(yù)測(cè): ·辦賽兼顧人才儲(chǔ)備與品牌建設(shè) ·賽題方向多樣化,數(shù)據(jù)密集型領(lǐng)域仍是主流 ·人工智能與數(shù)據(jù)科學(xué)競(jìng)賽成為企業(yè)公益新路徑 科研機(jī)構(gòu) 科研機(jī)構(gòu)以科研成果產(chǎn)出與科研人才培養(yǎng)為發(fā)展重心。其辦賽以精準(zhǔn)為重點(diǎn),吸引領(lǐng)域內(nèi)頂尖人才參賽是其辦賽的側(cè)重點(diǎn)。 企業(yè)辦賽現(xiàn)狀分析與趨勢(shì)預(yù)測(cè): ·科研機(jī)構(gòu)與高校主辦的賽事商業(yè)化氛圍較弱,主要集中在學(xué)科競(jìng)賽和跨學(xué)科科研攻關(guān)兩大方面。 3.2 賽事平臺(tái) 人工智能與數(shù)據(jù)科學(xué)競(jìng)賽需要的賽事設(shè)計(jì)能力、技術(shù)支持能力、賽事運(yùn)營(yíng)宣傳能力可能超出部分主辦機(jī)構(gòu)的能力或職責(zé)之外。因此賽事平臺(tái)成為將數(shù)據(jù)資源轉(zhuǎn)化為完整競(jìng)賽的重要第三方。 賽事平臺(tái)的主要職責(zé)包括三方面 :賽事設(shè)計(jì)、技術(shù)支撐與賽事運(yùn)營(yíng)。 3.3第三方獨(dú)立平臺(tái) DC競(jìng)賽 DataCastle數(shù)據(jù)城堡平臺(tái)于2016年正式上線,由電子科技大學(xué)大數(shù)據(jù)研究中心主任周濤教授發(fā)起成立,平臺(tái)基于公司多年競(jìng)賽業(yè)務(wù)體系得技術(shù)沉淀,為用戶(hù)提供競(jìng)賽、實(shí)訓(xùn)、人工智能實(shí)驗(yàn)室、算力資源等服務(wù)。 DC競(jìng)賽以Kaggle競(jìng)賽模式為藍(lán)本,采用平臺(tái)化、模塊化、自動(dòng)化的辦賽方式,同時(shí)結(jié)合國(guó)內(nèi)具體辦賽需求,基于自研數(shù)據(jù)科學(xué)實(shí)訓(xùn)平臺(tái)DCLab與相關(guān)專(zhuān)利,為主辦方提供定制化辦賽服務(wù)。經(jīng)過(guò)多年辦賽實(shí)踐,DC競(jìng)賽平臺(tái)發(fā)展成為國(guó)內(nèi)領(lǐng)先的第三方辦賽服務(wù)供應(yīng)商,平臺(tái)注冊(cè)用戶(hù)超過(guò)32.5萬(wàn)人,上線賽題500余道,累計(jì)發(fā)放獎(jiǎng)金9700余萬(wàn)元。 和鯨社區(qū) 和鯨社區(qū)(原 “科賽網(wǎng)”)成立于2015年,是中國(guó)知名的第三方數(shù)據(jù)科學(xué)社區(qū)之一,較早一批專(zhuān)注于大數(shù)據(jù)算法比賽的平臺(tái),擁有近20萬(wàn)注冊(cè)數(shù)據(jù)科學(xué)家用戶(hù), 輻射超過(guò)30萬(wàn)數(shù)據(jù)人才群體。 DF競(jìng)賽 DF競(jìng)賽(DataFountain)是北京數(shù)聯(lián)眾創(chuàng)科技有限公司旗下品牌, 是國(guó)內(nèi)領(lǐng)先的數(shù)據(jù)競(jìng)賽服務(wù)平臺(tái)和數(shù)據(jù)智能協(xié)同創(chuàng)新平臺(tái),旨在圍繞協(xié)作、數(shù)據(jù)、知識(shí)、技能形成大數(shù)據(jù)愛(ài)好者的專(zhuān)業(yè)成長(zhǎng)鏈路,為數(shù)據(jù)科學(xué)家及產(chǎn)業(yè)賦能。 3.4企業(yè)自建平臺(tái) 天池 阿里集團(tuán)于2014年正式推出 “天池” 大數(shù)據(jù)科研平臺(tái), 該平臺(tái)基于阿里云的開(kāi)放數(shù)據(jù)處理服ODPS, 面向?qū)W術(shù)界開(kāi)放海量數(shù)據(jù)(阿里數(shù)據(jù)及第三方數(shù)據(jù))和分布式計(jì)算資源,平臺(tái)業(yè)務(wù)包括 :天池大數(shù)據(jù)競(jìng)賽、數(shù)據(jù)實(shí)驗(yàn)室、開(kāi)放式教學(xué)、數(shù)據(jù)人才認(rèn)證。 飛槳AI Studio 飛槳AI Studio是基于百度深度學(xué)習(xí)平臺(tái)飛槳的人工智能學(xué)習(xí)與實(shí)訓(xùn)社區(qū), 提供在線編程環(huán)境、免費(fèi) GPU 算力、海量開(kāi)源算法和開(kāi)放數(shù)據(jù),幫助開(kāi)發(fā)者快速創(chuàng)建和部署模型。分設(shè)飛槳大賽、飛槳常規(guī)賽、新人練習(xí)賽等賽事分類(lèi)。 華為云 華為云大賽是華為云開(kāi)發(fā)者平臺(tái)打造得開(kāi)發(fā)者綜合賽事平臺(tái),其競(jìng)賽內(nèi)容涵蓋機(jī)器學(xué)習(xí)、軟件開(kāi)發(fā)、硬件開(kāi)發(fā)、系統(tǒng)開(kāi)發(fā)、工業(yè)互聯(lián)網(wǎng)等眾多方向。華為云賽事平臺(tái)嚴(yán)格來(lái)說(shuō)并非數(shù)據(jù)科學(xué)競(jìng)賽平臺(tái),而是綜合性開(kāi)發(fā)者賽事平臺(tái),并且只為華為集團(tuán)自身業(yè)務(wù)服務(wù)。 3.5參賽者 身份特征 學(xué)歷特征:在學(xué)歷背景方面,參賽者群體中60%左右為碩博人才,本科人才占比37.88%。在人才專(zhuān)業(yè)情況方面,其中87%左右的人工智能與數(shù)據(jù)科學(xué)競(jìng)賽人才來(lái)自于理工科背景。由于經(jīng)濟(jì)管理學(xué)科與數(shù)據(jù)密切相關(guān),諸多賽題來(lái)自金融領(lǐng)域,因此還有部分競(jìng)賽人才來(lái)自經(jīng)濟(jì)學(xué)、管理學(xué)專(zhuān)業(yè)。 職業(yè)特征 學(xué)生是競(jìng)賽人才的主力,占比約64%,在職人員多數(shù)將人工智能與數(shù)據(jù)科學(xué)競(jìng)賽作為技能練兵場(chǎng)和興趣俱樂(lè)部,主要人群為IT及相關(guān)行業(yè)的工作者,以及從事金融、咨詢(xún)等與數(shù)據(jù)相關(guān)方面的工作者。 地域特征
參賽者訴求 根據(jù)參賽者的典型特征進(jìn)行歸類(lèi)總結(jié)能夠幫助我們更好地進(jìn)行賽事設(shè)計(jì),并分析研判未來(lái)賽事的發(fā)展方向。 ·獎(jiǎng)金名譽(yù)訴求:以獎(jiǎng)金激勵(lì)和名譽(yù)獲取為核心訴求的參賽者以在校學(xué)生和職場(chǎng)新人為主,可支配時(shí)間充裕,技術(shù)實(shí)力較高,有沖擊獎(jiǎng)金和 TOP 排名的精力與實(shí)力,這些參賽者也是各大競(jìng)賽前排選手的重要組成部分。 ·就業(yè)創(chuàng)業(yè)訴求:以就業(yè)創(chuàng)業(yè)為核心訴求的參賽者求具有很強(qiáng)的針對(duì)性,主要參與某類(lèi)垂直領(lǐng)域的專(zhuān)業(yè)賽事,如金融、科技、生物醫(yī)藥等。 ·學(xué)習(xí)提升訴求:以獲取數(shù)據(jù)和技能實(shí)訓(xùn)為核心訴求的參賽者主要由數(shù)據(jù)科學(xué)初學(xué)者為主,受限于數(shù)據(jù)獲取困難和實(shí)訓(xùn)機(jī)會(huì)匱乏而選擇參賽,是各大賽事中占比最高的參與者。這些參賽者技術(shù)實(shí)力較弱,但學(xué)習(xí)意愿強(qiáng),有機(jī)會(huì)發(fā)展為競(jìng)賽核心選手。 ·社交活動(dòng)訴求:以社交活動(dòng)為核心訴求的參賽者數(shù)量少,影響力大。在競(jìng)賽社區(qū)加速發(fā)展的環(huán)境下, 部分競(jìng)賽深度選手開(kāi)始組建交流社區(qū)、俱樂(lè)部、自媒體平臺(tái),成為競(jìng)賽領(lǐng)域意見(jiàn)領(lǐng)袖,對(duì)競(jìng)賽運(yùn)營(yíng)招募與輿情風(fēng)向施加巨大影響力。
4.賽事基本架構(gòu)拆解
5.前景展望 5.1 平衡數(shù)字中國(guó)建設(shè)區(qū)域差異,賦能數(shù)字政府生態(tài)發(fā)展。 5.2 數(shù)字中國(guó)展開(kāi)布局,數(shù)據(jù)要素相關(guān)競(jìng)賽或納入考核指標(biāo)。 5.3 成果落地案例涌現(xiàn),價(jià)值轉(zhuǎn)化路徑逐漸清晰。 5.4 解決人才招聘痛點(diǎn),利用考核操作過(guò)程的評(píng)分系統(tǒng)精準(zhǔn)評(píng)估技能。 5.5 科研教學(xué)為微型賽事提供落地場(chǎng)景。 5.6 AIGC帶來(lái)AI革命,NLP賽題將成為新一階段熱點(diǎn)。 5.7 仿真賽題貼進(jìn)實(shí)際問(wèn)題,強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)最優(yōu)解或成為熱門(mén)賽題類(lèi)型。 5.8 線上賽事青睞云端環(huán)境,線下賽事追求競(jìng)技感。 【查看完整高清文件】關(guān)注“國(guó)家基因庫(kù)大數(shù)據(jù)平臺(tái)”公眾號(hào) → 后臺(tái)回復(fù)關(guān)鍵詞“白皮書(shū)”→ 即可收到高清文件鏈接 |