曙光攜手復(fù)旦大學(xué),共筑國際“表型組研究平臺”
摘要: 誰能想到,一條不起眼的耳垂折痕,可能與冠心病發(fā)病的概率相關(guān),因?yàn)樗鼈冴P(guān)聯(lián)著同一個基因。在人類表型組研究中,醫(yī)生可以通過觀察外觀表型,來判斷患者罹患冠心病的風(fēng)險(xiǎn)??梢哉f,
誰能想到,一條不起眼的耳垂折痕,可能與冠心病發(fā)病的概率相關(guān),因?yàn)樗鼈冴P(guān)聯(lián)著同一個基因。
在人類表型組研究中,醫(yī)生可以通過觀察外觀表型,來判斷患者罹患冠心病的風(fēng)險(xiǎn)??梢哉f,人類表型組研究是“后基因時代”的戰(zhàn)略制高點(diǎn),如果這條線被研究透徹,從微觀到宏觀的各個維度表型之間的關(guān)系都能一覽無遺,屆時,或許人類健康之謎就能被徹底解決。
近日,復(fù)旦大學(xué)攜手曙光共同建設(shè)的國際人類表型組學(xué)研究平臺(以下簡稱:研究平臺),通過對人類表型組在物理、化學(xué)和生物層面進(jìn)行跨尺度多維度研究,滿足人類表型組數(shù)據(jù)的存儲、共享和應(yīng)用,形成服務(wù)全國的生物醫(yī)學(xué)大數(shù)據(jù)研究與應(yīng)用設(shè)施。
表型數(shù)據(jù)與信息技術(shù) 共筑“生命健康密碼”
人類表型組的研究需要信息技術(shù)提供強(qiáng)有力的計(jì)算工具,借助先進(jìn)的IT技術(shù)解決方案,完成海量實(shí)驗(yàn)數(shù)據(jù)的存儲、讀取與挖掘處理。同時,信息技術(shù)還有助于加強(qiáng)表型數(shù)據(jù)庫的數(shù)據(jù)管理、信息傳遞、檢索和資源共享等。
作為跨尺度多維度人類表型組研究平臺,這里設(shè)有人體成像與測量、睡眠與生物電、人體能量代謝艙等多個測量實(shí)驗(yàn)室,可檢測約2萬個表型詞條,比如分子蛋白質(zhì)組、分子代謝組、細(xì)胞表型、語音表型等等。這些人類表型組相關(guān)數(shù)據(jù)將用于探索基因、人體特征與疾病健康之間的關(guān)系,為疾病預(yù)防與干預(yù)提供關(guān)鍵線索與指引,解讀人類生命密碼所需的關(guān)鍵信息。
同時,研究平臺以海量表型數(shù)據(jù)資源的高等級安全保存為核心,實(shí)現(xiàn)數(shù)據(jù)資源的匯聚、管理、共享和挖掘,形成我國人群健康表型組標(biāo)準(zhǔn)化技術(shù)體系,構(gòu)建中國健康人群表型圖譜及數(shù)據(jù)庫。
高效存儲共享與應(yīng)用 提高組學(xué)科研質(zhì)量
人類表型組項(xiàng)目涉及的主要應(yīng)用為基因測序、序列拼接軟件如SOAP2,BWA,BWASW 、Bowtie/Bowtie 2SHARCGS等,在計(jì)算時會產(chǎn)生海量的中間數(shù)據(jù)。存儲系統(tǒng)性能的好壞對計(jì)算效率將產(chǎn)生很大影響。因此,在人類表型組項(xiàng)目中,一方面要保證存儲系統(tǒng)的高讀寫性能;另一方面,要減少序列拼接程序運(yùn)行時對存儲系統(tǒng)的影響。
針對生物基因領(lǐng)域測序產(chǎn)生海量小文件的情況,曙光分布式存儲系統(tǒng)ParaStor通過Scale-Out橫向擴(kuò)展、IB+RDMA高速互聯(lián)、內(nèi)核態(tài)POSIX協(xié)議、智能SSD Cache及小文件聚合等技術(shù),消除傳統(tǒng)的Scale-up縱向擴(kuò)展存儲架構(gòu)的性能局限性,有效解決生物基因應(yīng)用中對海量大文件存儲場景高聚合帶寬、小文件存儲場景高IOPS的存儲需求。
ParaStor可通過性能與容量的線性增長,滿足對存儲系統(tǒng)數(shù)據(jù)處理能力和擴(kuò)展性的要求。此外,針對業(yè)務(wù)系統(tǒng)對可靠性、穩(wěn)定性的需求,ParaStor分布式存儲系統(tǒng)通過多種技術(shù)手段,從物理底層到邏輯層全方位保證存儲系統(tǒng)高可靠性和高可用性。豐富的協(xié)議接口,多類型數(shù)據(jù)融合存儲,可以保證多業(yè)務(wù)共享。
在復(fù)旦大學(xué)國際人類表型組學(xué)研究平臺項(xiàng)目中,ParaStor大幅度提高海量人類表型組數(shù)據(jù)的存儲、共享和應(yīng)用效率,在提升我國組學(xué)數(shù)據(jù)質(zhì)量意識、引領(lǐng)國際標(biāo)準(zhǔn)研發(fā)、推動我國生物醫(yī)學(xué)領(lǐng)域原創(chuàng)研究的過程中起到了重要的作用。
表型,人類,存儲








鄂托克旗|
霞浦县|
沅江市|
惠来县|
龙门县|
洛南县|
洪湖市|
青州市|
和平县|
故城县|
高淳县|
资溪县|
永吉县|
开江县|
高州市|
郎溪县|
鹤山市|
襄樊市|
汉源县|
察雅县|
房山区|
百色市|
吉隆县|
徐州市|
外汇|
海盐县|
海门市|
吴江市|
旬阳县|
福安市|
鹤山市|
崇阳县|
英吉沙县|
松江区|
大名县|
邵东县|
喀什市|
安徽省|
五峰|
宜黄县|
廊坊市|