生命健康科學(xué)研究已進(jìn)入數(shù)據(jù)密集型大模型時(shí)代,而生物數(shù)據(jù)庫(kù)主要由美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)和歐洲生物信息學(xué)研究所(EBI)兩個(gè)中心領(lǐng)導(dǎo),中國(guó)在這個(gè)方面缺乏國(guó)際影響力。EBI負(fù)責(zé)人Rolf Apweiler指出兩個(gè)問(wèn)題:中國(guó)缺少一個(gè)明確的代表性科學(xué)中心可以代表中國(guó)接軌國(guó)際;中國(guó)科學(xué)家使用了歐洲生物信息學(xué)研究所超過(guò)三分之一的資源,但在數(shù)據(jù)和數(shù)據(jù)庫(kù)維護(hù)上缺乏貢獻(xiàn)。黨中央高度重視生物大數(shù)據(jù)資源發(fā)展,提出了國(guó)家生物數(shù)據(jù)中心“1+N”體系建設(shè)思路。國(guó)家發(fā)改委先期聚焦組學(xué)數(shù)據(jù)立項(xiàng)了“1”國(guó)家生物信息中心,“N”僅聚焦文獻(xiàn)數(shù)據(jù)立項(xiàng)了國(guó)家生物醫(yī)學(xué)文獻(xiàn)信息中心,尚缺乏以疾病為核心的系統(tǒng)全面的數(shù)據(jù)資源。
粵港澳大灣區(qū)建設(shè),是習(xí)近平總書記親自謀劃、親自部署、親自推動(dòng)的重大國(guó)家戰(zhàn)略,也是我國(guó)經(jīng)濟(jì)發(fā)展重要區(qū)域與對(duì)外經(jīng)貿(mào)交流的南大門,GDP超全國(guó)總量12%,其中,大健康產(chǎn)業(yè)是粵港澳大灣區(qū)核心支柱產(chǎn)業(yè)之一。通過(guò)大數(shù)據(jù)的匯聚和關(guān)聯(lián)分析能夠更快、更直接地發(fā)現(xiàn)新知識(shí)、新機(jī)制、新規(guī)律,驅(qū)動(dòng)新技術(shù)、新成果的快速誕生與產(chǎn)業(yè)應(yīng)用。據(jù)文獻(xiàn)報(bào)道,以“臨床+多組學(xué)”為主的生物醫(yī)學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施支持了2/3以上FDA獲批的原研藥研發(fā)工作,每年獲得巨額產(chǎn)業(yè)回報(bào)。因此,建設(shè)支撐生命健康科學(xué)研究與生物醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的生物醫(yī)學(xué)數(shù)據(jù)節(jié)點(diǎn),既是粵港澳大灣區(qū)經(jīng)濟(jì)持續(xù)繁榮的必然要求,也是落實(shí)粵港澳大灣區(qū)國(guó)家戰(zhàn)略的重要支撐。
近百年來(lái),對(duì)人類生命健康產(chǎn)生深遠(yuǎn)影響的重大突發(fā)公共衛(wèi)生事件無(wú)一不是由呼吸系統(tǒng)傳染病導(dǎo)致的?;浉郯拇鬄硡^(qū)地處亞熱帶,氣候溫和適合病毒傳播,同時(shí)還是我國(guó)對(duì)外經(jīng)貿(mào)交流的南大門,入境人數(shù)占全國(guó)90%以上,常住人口超8000萬(wàn)人,是傳染病“外防輸入、內(nèi)防傳播”的重點(diǎn)區(qū)域。在粵港澳大灣區(qū)建立支撐呼吸系統(tǒng)傳染病監(jiān)測(cè)預(yù)警與快速主動(dòng)應(yīng)對(duì)的生物醫(yī)學(xué)數(shù)據(jù)節(jié)點(diǎn),是及時(shí)了解疫情動(dòng)態(tài)、制定科學(xué)有效防控策略的必要手段。通過(guò)收集并加以整理分析區(qū)域內(nèi)生物醫(yī)學(xué)數(shù)據(jù)與境內(nèi)外呼吸道傳染病的病例數(shù)據(jù)、病毒基因序列、人體多組學(xué)數(shù)據(jù)、流行病學(xué)信息等重要數(shù)據(jù),可及時(shí)了解全球范圍內(nèi)呼吸道傳染病疫情的頻發(fā)和傳播速度、疫情動(dòng)態(tài)與防控策略,發(fā)現(xiàn)疫情的時(shí)空分布規(guī)律、預(yù)測(cè)疫情的爆發(fā)趨勢(shì),為公共衛(wèi)生防控決策提供決策支持和科學(xué)依據(jù),最大程度地保護(hù)我國(guó)人民群眾的健康安全。
因此,廣州國(guó)家實(shí)驗(yàn)室作為國(guó)家戰(zhàn)略科技力量,以解決新發(fā)突發(fā)病原重大疫情預(yù)測(cè)預(yù)警、呼吸系統(tǒng)疾病及其防控領(lǐng)域關(guān)鍵核心為己任,有意愿、有能力承建與長(zhǎng)期運(yùn)行國(guó)家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點(diǎn),助力我國(guó)生命健康科學(xué)研究與生物醫(yī)藥產(chǎn)業(yè)高質(zhì)量發(fā)展。
在廣東省廣州市的支持下,廣州國(guó)家實(shí)驗(yàn)室開展了前期工作,在軟硬件、數(shù)據(jù)資源和管理模式上已形成完善的小試到中試的技術(shù)能力,獲得了一系列初步成果,并具備清晰可落地的技術(shù)和市場(chǎng)轉(zhuǎn)化服務(wù)路徑。比如自主研發(fā)了支撐大規(guī)模算力資源管理、智能工具開發(fā)與集成、大模型驅(qū)動(dòng)到跨平臺(tái)資源共享的市場(chǎng)化工業(yè)軟件系統(tǒng)—“生物醫(yī)學(xué)大數(shù)據(jù)操作系統(tǒng)(Bio-OS)”;接入了50萬(wàn)余全球人類基因組數(shù)據(jù)集、10000余算子鏡像;匯聚了15PB數(shù)據(jù);建成了27億參數(shù)垂直領(lǐng)域大模型;啟動(dòng)了百萬(wàn)呼吸健康人群隊(duì)列研究,以及生物醫(yī)學(xué)科研與數(shù)據(jù)治理大模型建設(shè);與全國(guó)近1000家醫(yī)院達(dá)成戰(zhàn)略合作協(xié)議,與多所港澳科研機(jī)構(gòu)建立戰(zhàn)略合作關(guān)系;建設(shè)了5年可產(chǎn)出約400PB高質(zhì)量多組學(xué)數(shù)據(jù)與基礎(chǔ)實(shí)驗(yàn)數(shù)據(jù)的全鏈條科研平臺(tái)。
建議充分發(fā)揮國(guó)家實(shí)驗(yàn)室“總平臺(tái)總鏈長(zhǎng)”作用,以及廣州國(guó)家實(shí)驗(yàn)室在生物醫(yī)藥領(lǐng)域深厚積淀,建設(shè)面向呼吸系統(tǒng)疾病領(lǐng)域的“國(guó)家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點(diǎn)”。