中國教育報-中國教育新聞網(wǎng)訊(記者 任朝霞 通訊員 符云霞 江倩倩)3月22日,上海交通大學洪亮教授團隊發(fā)布最新研究成果,建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,并將AI與蛋白質(zhì)設計改造相結合,基于該數(shù)據(jù)集訓練了Venus(啟明星)系列模型,可以精準高效地預測、設計蛋白質(zhì)的功能。配合Venus系列模型,團隊還研制了全球首款低通量大體積蛋白質(zhì)表達、純化與功能檢測自動化一體機,把蛋白質(zhì)設計從“復雜科學”變?yōu)椤昂唵喂こ獭?。目前,已有多款產(chǎn)品進入規(guī)模化生產(chǎn),能夠助力阿爾茲海默癥等疾病的診斷。
蛋白質(zhì)是由氨基酸序列構成的,氨基酸序列的長度從數(shù)百個到上千個不等。據(jù)介紹,團隊建立的蛋白質(zhì)序列數(shù)據(jù)集包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列、0.6億條病毒蛋白質(zhì)序列,覆蓋從常規(guī)地表生物到極端環(huán)境微生物的蛋白質(zhì)序列信息,配備了數(shù)億功能標簽,是全球數(shù)據(jù)規(guī)模最大、功能批注標簽最多的數(shù)據(jù)集。
“我們訓練了Venus(啟明星)系列模型,這個模型學習自然界蛋白質(zhì)序列的組織規(guī)則以及它與功能之間的關系,其預測蛋白質(zhì)突變功能的精度位居行業(yè)榜單之首?!焙榱帘硎?,Venus系列模型具備兩大核心功能:“AI定向進化”與“AI挖酶”?!癆I定向進化”是指Venus系列模型可以對一個不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進行優(yōu)化?!癆I挖酶”則是指Venus系列模型基于其海量的未知功能蛋白質(zhì)數(shù)據(jù)集“海選”超能力戰(zhàn)士,去精準發(fā)掘滿足苛刻應用需求的具備超常規(guī)功能的蛋白質(zhì)。這些超常規(guī)功能的蛋白質(zhì)在生物技術、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有巨大的應用潛力。
配合Venus系列模型,團隊研發(fā)了自動化一體機,可在24小時內(nèi)不間斷地完成100余個蛋白質(zhì)的表達、純化與檢測任務,較人力效率提高近10倍。目前,Venus系列模型設計的多款蛋白質(zhì)已經(jīng)實現(xiàn)了產(chǎn)業(yè)化落地。在金賽藥業(yè)單域抗體耐堿性改造項目中,借助模型,不到1年就讓普通單域抗體耐堿性提升4倍,每年節(jié)約上千萬元成本。在某體外診斷公司堿性磷酸酶(ALP)改造項目中,模型使ALP分子活性超國際頭部公司產(chǎn)品3倍,為心梗、阿爾茲海默癥等超敏檢測診斷帶來新突破。
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網(wǎng)版權所有,未經(jīng)書面授權禁止下載使用
Copyright@2000-2022 m.tubemateyoutubedownloaderapps.com All Rights Reserved.