記者10日從中山大學(xué)獲悉,該校醫(yī)學(xué)院施莽教授團(tuán)隊與阿里云李兆融團(tuán)隊將人工智能(AI)技術(shù)應(yīng)用于病毒鑒定,發(fā)現(xiàn)了傳統(tǒng)研究方法未能發(fā)現(xiàn)的病毒“暗物質(zhì)”,探索了病毒學(xué)研究的新路徑。相關(guān)成果近日發(fā)表在國際期刊《細(xì)胞》上。
據(jù)介紹,傳統(tǒng)的病毒發(fā)現(xiàn)方法包括病毒分離和生命組學(xué)的生物信息學(xué)分析,高度依賴既有知識,對RNA病毒這種高度分化、種類繁多且容易變異的病毒識別率低。
在該研究中,團(tuán)隊開發(fā)的LucaProt人工智能算法,能夠?qū)Σ《竞头遣《净蚪M序列進(jìn)行深度學(xué)習(xí),并在數(shù)據(jù)集中自主判斷病毒序列。利用這套算法,團(tuán)隊在來自全球生物環(huán)境樣本的10487份RNA測序數(shù)據(jù)中發(fā)現(xiàn)了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超群,大幅擴(kuò)展了全球RNA病毒的多樣性。其中,23個超群無法通過序列同源方法識別,被稱為病毒圈的“暗物質(zhì)”。
“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這種能力在疾病防控和新病原的快速識別中尤為重要。特別是在疫情暴發(fā)時,人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體?!笔┟дf。
通過進(jìn)一步分析,團(tuán)隊報告了迄今最長的RNA病毒基因組,長度達(dá)到47250個核苷酸;發(fā)現(xiàn)了超出以往認(rèn)知的基因組結(jié)構(gòu),展現(xiàn)出RNA病毒基因組進(jìn)化的靈活性;識別到多種病毒功能蛋白,特別是與細(xì)菌相關(guān)的功能蛋白,進(jìn)一步表明還有更多類型的RNA噬菌體亟待探索;發(fā)現(xiàn)在南極底泥、深海熱泉、活性污泥和鹽堿灘等極端環(huán)境中,RNA病毒的數(shù)量和多樣性仍然較高。這些發(fā)現(xiàn)刷新了科學(xué)家對病毒圈的認(rèn)知。
“面對遠(yuǎn)源的新病毒,現(xiàn)有病毒分類體系已經(jīng)顯得力不從心。未來,這一體系在門、綱等更深層次的分類上,可能會有大規(guī)模調(diào)整?!笔┟дf,他們的研究展示了病毒多樣性的深度,但廣度仍有待更多樣本的補(bǔ)充。病毒的多樣性遠(yuǎn)超人類想象,目前看到的仍是冰山一角。
施莽表示,未來將繼續(xù)通過跨領(lǐng)域科研合作,充分利用云計算和人工智能優(yōu)勢,解決生命科學(xué)領(lǐng)域的重要問題。
來源:科技日報
原標(biāo)題:科學(xué)家借助AI技術(shù)發(fā)現(xiàn)病毒“暗物質(zhì)”
作者:記者龍躍梅 通訊員朱嘉豪 李建平
清美聯(lián)創(chuàng)秉承“四個面向”的企業(yè)哲學(xué)和價值觀——
面向人類健康
面向國防需要
面向“一帶一路”
面向人類命運(yùn)共同體
北京清美聯(lián)創(chuàng)干細(xì)胞科技有限公司致力于多種干細(xì)胞臨床應(yīng)用研究,人體冷凍、核輻射防治等技術(shù)研發(fā)。
目前已擁有67種不同功能的專能細(xì)胞如神經(jīng)干細(xì)胞、胰腺干細(xì)胞、卵巢干細(xì)胞、肝臟干細(xì)胞、心肌細(xì)胞、毛囊干細(xì)胞等的制備技術(shù)。
北京清美聯(lián)創(chuàng)干細(xì)胞科技有限公司服務(wù)咨詢與技術(shù)合作電話:010-88292706。