2022年10月29日,由深圳國(guó)家基因庫(kù)和深圳華大生命科學(xué)研究院共同研發(fā)的時(shí)空組學(xué)數(shù)據(jù)庫(kù)V1.0版本(STOmicsDB)在國(guó)家基因庫(kù)生命大數(shù)據(jù)平臺(tái)(CNGBdb)正式上線,致力于促進(jìn)時(shí)空組學(xué)的數(shù)據(jù)探索和學(xué)術(shù)研究。 STOmicsDB率先建立時(shí)空組數(shù)據(jù)歸檔標(biāo)準(zhǔn),實(shí)現(xiàn)時(shí)空組學(xué)不同層次數(shù)據(jù)的整合,并形成時(shí)空組學(xué)數(shù)據(jù)生態(tài)圈,是國(guó)際領(lǐng)先的時(shí)空組學(xué)綜合平臺(tái)。
數(shù)據(jù)資源 | 超全文獻(xiàn)+數(shù)據(jù)資源:STOmicsDB可實(shí)現(xiàn)時(shí)空組學(xué)不同層次數(shù)據(jù)的整合,對(duì)公共數(shù)據(jù)庫(kù)的6000多篇文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘,聯(lián)合時(shí)空數(shù)據(jù)匯交系統(tǒng),策劃了141個(gè)時(shí)空組學(xué)數(shù)據(jù)集,收錄超1000張時(shí)空切片數(shù)據(jù),覆蓋全面的時(shí)空組文獻(xiàn)和數(shù)據(jù)資源。 數(shù)據(jù)歸檔 | 全新時(shí)空匯交標(biāo)準(zhǔn) 填補(bǔ)領(lǐng)域空白:面對(duì)全新的時(shí)空組數(shù)據(jù)類型,STOmicsDB率先建立時(shí)空組數(shù)據(jù)歸檔標(biāo)準(zhǔn),以數(shù)據(jù)驅(qū)動(dòng)的形式,為時(shí)空組數(shù)據(jù)的統(tǒng)一匯交和開放共享建立基礎(chǔ)。 數(shù)據(jù)生態(tài) | 時(shí)空組學(xué)數(shù)據(jù)生態(tài)圈:STOmicsDB提供一站式服務(wù),包括:文獻(xiàn)追蹤→ 數(shù)據(jù)獲取→ 可視化探索 → 在線分析 → 數(shù)據(jù)歸檔→ 時(shí)空專輯數(shù)據(jù)庫(kù)發(fā)布,覆蓋時(shí)空組學(xué)數(shù)據(jù)全生命周期。 成果發(fā)表 | 時(shí)空專輯數(shù)據(jù)庫(kù)科研成果發(fā)布:STOmicsDB已支撐Nature、Science、Cell在內(nèi)的11篇文章發(fā)表,包括【時(shí)空組學(xué)聯(lián)盟第一批生命發(fā)育時(shí)空?qǐng)D譜】覆蓋小鼠、斑馬魚、果蠅、擬南芥四種模式生物胚胎或器官發(fā)育,【蠑螈腦再生時(shí)空?qǐng)D譜】等。
為什么要搭建STOmicsDB? 時(shí)空組學(xué)技術(shù)從時(shí)間和空間維度上,對(duì)生命發(fā)育過程中的基因和細(xì)胞變化過程進(jìn)行超高精度解析,在腦科學(xué)研究、疾病研究、物種發(fā)育、生命起源等領(lǐng)域開展研究,全面提升了人類對(duì)生命認(rèn)知和疾病定義。 隨著時(shí)空組技術(shù)的發(fā)展,產(chǎn)生海量時(shí)空組數(shù)據(jù),缺乏統(tǒng)一的數(shù)據(jù)歸檔標(biāo)準(zhǔn)和專業(yè)的數(shù)據(jù)資源庫(kù),以數(shù)據(jù)驅(qū)動(dòng)為導(dǎo)向的大數(shù)據(jù)整合、挖掘與解析面臨挑戰(zhàn),生命科學(xué)領(lǐng)域亟需建設(shè)一個(gè)時(shí)空組學(xué)數(shù)據(jù)庫(kù)。
STOmicsDB:“一站式”賦能時(shí)空組學(xué)研究 面對(duì)新挑戰(zhàn),深圳國(guó)家基因庫(kù)聯(lián)合深圳華大生命科學(xué)研究院共同研發(fā)時(shí)空組學(xué)綜合資源平臺(tái)——時(shí)空組學(xué)數(shù)據(jù)庫(kù)STOmicsDB,為充分探索時(shí)空組學(xué)數(shù)據(jù),服務(wù)基礎(chǔ)科學(xué)研究,構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)分析流程,搭建結(jié)構(gòu)化元信息審編模型,強(qiáng)力支撐時(shí)空領(lǐng)域的科學(xué)研究。
上圖STOmicsDB V1.0架構(gòu) ?科研資源多維解析 全面提升檢索效率 STOmicsDB通過機(jī)器學(xué)習(xí)和人工策劃,已收錄時(shí)空組學(xué)主題6000多篇文獻(xiàn)和141個(gè)數(shù)據(jù)集,建立了基于時(shí)空文獻(xiàn)的知識(shí)圖譜,從文獻(xiàn)、數(shù)據(jù)集、研究人員、數(shù)據(jù)分析方法、實(shí)驗(yàn)技術(shù),5個(gè)維度全面探索時(shí)空知識(shí),以多維度的數(shù)據(jù)檢索,提升科研資源檢索效率。同時(shí),我們邀請(qǐng)文章作者和專家對(duì)時(shí)空文獻(xiàn)進(jìn)行文獻(xiàn)解讀,發(fā)布于文獻(xiàn)解讀專欄(Report板塊),方便科研人員在第一時(shí)間獲取最新的時(shí)空資訊。 ?時(shí)空數(shù)據(jù)生態(tài)閉環(huán) 推進(jìn)領(lǐng)域科研轉(zhuǎn)化 STOmicsDB提供數(shù)據(jù)資源中心、數(shù)據(jù)在線分析、交互式可視化工具、數(shù)據(jù)歸檔服務(wù),時(shí)空專輯數(shù)據(jù)庫(kù)等服務(wù),形成時(shí)空組學(xué)數(shù)據(jù)生態(tài)圈,科研人員可以通過在STOmicsDB完成時(shí)空組學(xué)數(shù)據(jù)的安全管理、在線分析和可視化探索,實(shí)現(xiàn)最大化發(fā)現(xiàn)數(shù)據(jù)價(jià)值,加速時(shí)空組學(xué)領(lǐng)域科研成果發(fā)表和應(yīng)用轉(zhuǎn)化。 【Dataset-時(shí)空組學(xué)數(shù)據(jù)集】 STOmicsDB通過時(shí)空數(shù)據(jù)匯交系統(tǒng)和深度挖掘公共數(shù)據(jù)資源,將相互獨(dú)立的公共數(shù)據(jù)資源,進(jìn)行數(shù)據(jù)質(zhì)控和標(biāo)準(zhǔn)化分析,整合不同層次時(shí)空組學(xué)數(shù)據(jù),形成了一致可對(duì)比的數(shù)據(jù)集。 時(shí)空數(shù)據(jù)集搭載了時(shí)空?qǐng)D譜可視化工具,基于WebGL引擎,兼容web瀏覽器,渲染高性能的交互式3D圖形,秒級(jí)響應(yīng)百萬spot數(shù)據(jù),有助于時(shí)空組可視化瀏覽和深度挖掘。 【Submission-時(shí)空組學(xué)數(shù)據(jù)歸檔】 STOmicsDB實(shí)現(xiàn)時(shí)空組學(xué)不同層次數(shù)據(jù)的收錄與整合,建立了空間轉(zhuǎn)錄組數(shù)據(jù)歸檔標(biāo)準(zhǔn),為全球時(shí)空組數(shù)據(jù)的統(tǒng)一匯交和開放共享建立基礎(chǔ)。同時(shí)提供時(shí)空組數(shù)據(jù)可視化工具,將空間特異性數(shù)據(jù)用圖形界面進(jìn)行展示,方便研究者更加直觀地探索和分析數(shù)據(jù),以數(shù)據(jù)驅(qū)動(dòng)的形式,支持前沿科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新。 【Analysis-時(shí)空組學(xué)數(shù)據(jù)分析】 Analysis模塊作為時(shí)空數(shù)據(jù)的分析利器,提供了Gene search、Compare、SingleR三種分析工具。通過跨數(shù)據(jù)集聯(lián)合分析的功能,幫助科研人員從全局角度對(duì)時(shí)空組數(shù)據(jù)進(jìn)行對(duì)比,從多維度查看不同物種、不同發(fā)育階段、不同疾病進(jìn)程、不同癌癥種類、正常與疾病分組的基因表達(dá)等數(shù)據(jù)差異。 【Collections-時(shí)空專輯數(shù)據(jù)庫(kù)】 STOmicsDB以“時(shí)空專輯數(shù)據(jù)庫(kù)”發(fā)布科研成果,構(gòu)建數(shù)據(jù)庫(kù)是對(duì)測(cè)序數(shù)據(jù)和分析數(shù)據(jù)的最好管理方式,時(shí)空專輯數(shù)據(jù)庫(kù)提供時(shí)空?qǐng)D譜可視化分析工具和3D可視化工具進(jìn)行數(shù)據(jù)探索,支持Aspera等高速下載工具,全面提升成果轉(zhuǎn)化率,推動(dòng)領(lǐng)域創(chuàng)新發(fā)展。 目前Collections模塊已發(fā)布7個(gè)時(shí)空組數(shù)據(jù)專輯,包括時(shí)空組學(xué)聯(lián)盟第一批生命時(shí)空?qǐng)D譜專輯數(shù)據(jù)庫(kù),覆蓋小鼠、斑馬魚、果蠅、擬南芥四種模式生物的時(shí)空?qǐng)D譜,蠑螈腦再生時(shí)空?qǐng)D譜,猴腦時(shí)空?qǐng)D譜等。 【Codeplot-時(shí)空生態(tài)建設(shè)與人才培養(yǎng)】 此外,研發(fā)團(tuán)隊(duì)在國(guó)家基因庫(kù)可信計(jì)算平臺(tái)Codeplot搭建了STOmicsDB數(shù)據(jù)集,部署了STUtility等時(shí)空組學(xué)分析工具,加強(qiáng)了時(shí)空數(shù)據(jù)的可拓展性,國(guó)家基因庫(kù)攜手一線科研工作者,將開展《時(shí)空組訓(xùn)練營(yíng)》公益課程,助力時(shí)空生態(tài)建設(shè)與人才培養(yǎng)。
如何訪問STOmicsDB? 搜索引擎搜索“國(guó)家基因庫(kù)生命大數(shù)據(jù)平臺(tái)” → 訪問【國(guó)家基因庫(kù)生命大數(shù)據(jù)平臺(tái)】→ 導(dǎo)航欄點(diǎn)擊【科學(xué)數(shù)據(jù)庫(kù)】→ 點(diǎn)擊【STOmicsDB:空間轉(zhuǎn)錄組學(xué)數(shù)據(jù)庫(kù)】 * STOmicsDB由CNGBdb團(tuán)隊(duì)設(shè)計(jì)開發(fā),如果您有任何問題和建議, 可隨時(shí)聯(lián)系CNGBdb@cngb.org。 |