這是記者在天壤XLab看到的相關(guān)應(yīng)用。
2022年10月,天壤XLab上線了蛋白質(zhì)自由設(shè)計(jì)平臺(tái)xCREATOR,面向高校師生免費(fèi)開放,不足半年,該平臺(tái)已累積有五六百用戶。日前,《科創(chuàng)板日?qǐng)?bào)》記者從天壤XLab處進(jìn)一步了解到,今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也已正式上線。
支撐這些平臺(tái)的技術(shù)就是蛋白質(zhì)結(jié)構(gòu)的自動(dòng)生成技術(shù),后者也是人工智能的核心技術(shù)之一。另有跡象表明,自動(dòng)生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用正在逐漸增多:
今年2月,科創(chuàng)板合成生物學(xué)上市公司凱賽生物宣布領(lǐng)投AI蛋白質(zhì)設(shè)計(jì)平臺(tái)公司分子之心的新一輪戰(zhàn)略投資;同在2月,初創(chuàng)企業(yè)賽得康宣布完成了數(shù)千萬(wàn)元的種子輪融資,AI設(shè)計(jì)+蛋白模塊是企業(yè)的關(guān)鍵詞。
“其實(shí),人工智能所依托的AI生成技術(shù)并非新技術(shù),很多公司都已經(jīng)有所積累并陸續(xù)開始應(yīng)用了。之前有個(gè)語(yǔ)言模型BERT就被用于蛋白質(zhì)生成了,取得了不錯(cuò)的成果?!币患倚袠I(yè)企業(yè)對(duì)記者表示,只不過(guò),當(dāng)人工智能走熱之后,AI生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用也逐漸走進(jìn)了公眾的視野。
記者注意到,當(dāng)互聯(lián)網(wǎng)科技向AI迭代升級(jí)后,很快,AI的應(yīng)用就從TMT涌向了生物醫(yī)藥,AI+藥物發(fā)現(xiàn)一度成為一級(jí)市場(chǎng)的投資熱詞;類似的情況,會(huì)不會(huì)也發(fā)生在人工智能+藥物發(fā)現(xiàn)上呢?
▌氨基酸恰類似于大數(shù)據(jù)
記者了解到,自動(dòng)生成技術(shù)之所以可應(yīng)用到蛋白質(zhì)的發(fā)現(xiàn)上,有這樣的科學(xué)邏輯支撐:
蛋白質(zhì)是由氨基酸通過(guò)不同的排列組合聚合而成,每個(gè)蛋白質(zhì)的三維結(jié)構(gòu)又決定了它的功能作用。在算法人的眼中,氨基酸就類似于數(shù)據(jù)、蛋白質(zhì)的三維結(jié)構(gòu)類似于圖像,通過(guò)數(shù)據(jù)及圖像的不同排列組合訓(xùn)練,AI就能實(shí)現(xiàn)自生成。
在業(yè)內(nèi),這一邏輯也被稱為AIGP,即AI Generated Protein(AI生成蛋白質(zhì))。
在天壤XLab,記者看到了相關(guān)應(yīng)用:
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
去年10月,具備該功能的xCREATOR工作臺(tái)正式上線,面向高校師生免費(fèi)開放;今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也正式上線。
“我們還附加了一系列設(shè)計(jì)蛋白質(zhì)的分析功能,可以對(duì)各類由算法自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)進(jìn)行打分,分?jǐn)?shù)越高表示該自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)的可實(shí)現(xiàn)性越高?!碧烊繶Lab實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士介紹稱。
在人工智能中,需要人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、打分,以此來(lái)訓(xùn)練算法更會(huì)聊天;AIGP也是類似的邏輯,但不同的是,如果科研人員要想知道某一由算法自動(dòng)生成的蛋白質(zhì),其可實(shí)現(xiàn)性到底高不高,還需要通過(guò)進(jìn)一步的濕實(shí)驗(yàn)來(lái)驗(yàn)證,因此,AIGP的技術(shù)壁壘也就更高。
為了降低這一技術(shù)門檻,引入打分模型算法是很多企業(yè)的選擇。
前述行業(yè)企業(yè)對(duì)《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步解釋了生成算法與打分算法的工作邏輯:第一,由生成模型算法生成蛋白質(zhì);第三,由人工對(duì)經(jīng)打分模型篩選出的、得分較高的蛋白質(zhì),再進(jìn)行實(shí)驗(yàn)驗(yàn)證,并反饋給打分模型算法?!岸呔拖窭项B童的左右兩手互搏,通過(guò)不斷增強(qiáng)學(xué)習(xí),來(lái)提高算法的質(zhì)量。”
▌探索大分子宇宙
有了AIGP,對(duì)于科研人員來(lái)說(shuō),最大的獲益無(wú)疑是加速了研發(fā)的進(jìn)展。
“以100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)為例,其序列的排列組合有高達(dá)20^100=1.3×10^130種可能!相比之下,人類可觀測(cè)宇宙總原子數(shù)量?jī)H有10^82,以人力來(lái)測(cè)試、構(gòu)想這樣龐大的蛋白質(zhì)空間可以說(shuō)是不可能完成的任務(wù)。”苗洪江稱,如今AI模型能夠精準(zhǔn)**到符合要求的蛋白質(zhì)再由研發(fā)人員進(jìn)行實(shí)驗(yàn)檢驗(yàn),蛋白質(zhì)設(shè)計(jì)效率前所未有的提升使其終于可以走進(jìn)產(chǎn)業(yè)應(yīng)用中去。
更重要的是,過(guò)去基于偶然性的開發(fā)工作也極大限制了人類對(duì)于蛋白質(zhì)的開發(fā),人類已知的天然蛋白質(zhì)數(shù)量為10^15,而潛在的從頭設(shè)計(jì)蛋白質(zhì)數(shù)量遠(yuǎn)超于已知天然蛋白質(zhì)。
以人體內(nèi)的蛋白質(zhì)來(lái)說(shuō),“目前大多數(shù)人類蛋白質(zhì)功能研究都聚焦于約5000種研究較多的人類蛋白質(zhì),而人體內(nèi)還存在著一個(gè)巨大的蛋白質(zhì)世界。事實(shí)上,這些功能未知的蛋白質(zhì)可能掌握著打開解決人類重大疾病的鑰匙,如癌癥、阿爾茲海默癥以及多種罕見病。”苗博士解釋稱。
除生命科學(xué)外,新材料、新能源和食品等領(lǐng)域?qū)δ艿鞍踪|(zhì)也存有巨大的需求?!罢麄€(gè)蛋白質(zhì)世界還擁有巨大的潛在探索空間,蘊(yùn)藏著無(wú)窮無(wú)盡的資源,具有極大應(yīng)用價(jià)值!”天壤CEO薛貴榮博士表示,蛋白質(zhì)領(lǐng)域的人工智能會(huì)成為像水、電、煤一樣成為工業(yè)發(fā)展支撐,開辟出全新的科學(xué)時(shí)代。
《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步了解到,如何獲取行業(yè)數(shù)據(jù)、如何通過(guò)實(shí)驗(yàn)驗(yàn)證來(lái)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注進(jìn)而得到高質(zhì)量的反饋數(shù)據(jù)仍然是限制AIGP大爆發(fā)的主要攔路虎?;诖?,開源共享仍是目前行業(yè)企業(yè)們的主要選擇。
本文由小編網(wǎng)絡(luò)轉(zhuǎn)載而成,原文來(lái)源:http://www.techweb.com.cn/it/2023-03-07/2921802.shtml,如有侵權(quán),請(qǐng)聯(lián)系刪除
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
這是記者在天壤XLab看到的相關(guān)應(yīng)用。
2022年10月,天壤XLab上線了蛋白質(zhì)自由設(shè)計(jì)平臺(tái)xCREATOR,面向高校師生免費(fèi)開放,不足半年,該平臺(tái)已累積有五六百用戶。日前,《科創(chuàng)板日?qǐng)?bào)》記者從天壤XLab處進(jìn)一步了解到,今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也已正式上線。
支撐這些平臺(tái)的技術(shù)就是蛋白質(zhì)結(jié)構(gòu)的自動(dòng)生成技術(shù),后者也是人工智能的核心技術(shù)之一。另有跡象表明,自動(dòng)生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用正在逐漸增多:
今年2月,科創(chuàng)板合成生物學(xué)上市公司凱賽生物宣布領(lǐng)投AI蛋白質(zhì)設(shè)計(jì)平臺(tái)公司分子之心的新一輪戰(zhàn)略投資;同在2月,初創(chuàng)企業(yè)賽得康宣布完成了數(shù)千萬(wàn)元的種子輪融資,AI設(shè)計(jì)+蛋白模塊是企業(yè)的關(guān)鍵詞。
“其實(shí),人工智能所依托的AI生成技術(shù)并非新技術(shù),很多公司都已經(jīng)有所積累并陸續(xù)開始應(yīng)用了。之前有個(gè)語(yǔ)言模型BERT就被用于蛋白質(zhì)生成了,取得了不錯(cuò)的成果?!币患倚袠I(yè)企業(yè)對(duì)記者表示,只不過(guò),當(dāng)人工智能走熱之后,AI生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用也逐漸走進(jìn)了公眾的視野。
記者注意到,當(dāng)互聯(lián)網(wǎng)科技向AI迭代升級(jí)后,很快,AI的應(yīng)用就從TMT涌向了生物醫(yī)藥,AI+藥物發(fā)現(xiàn)一度成為一級(jí)市場(chǎng)的投資熱詞;類似的情況,會(huì)不會(huì)也發(fā)生在人工智能+藥物發(fā)現(xiàn)上呢?
▌氨基酸恰類似于大數(shù)據(jù)
記者了解到,自動(dòng)生成技術(shù)之所以可應(yīng)用到蛋白質(zhì)的發(fā)現(xiàn)上,有這樣的科學(xué)邏輯支撐:
蛋白質(zhì)是由氨基酸通過(guò)不同的排列組合聚合而成,每個(gè)蛋白質(zhì)的三維結(jié)構(gòu)又決定了它的功能作用。在算法人的眼中,氨基酸就類似于數(shù)據(jù)、蛋白質(zhì)的三維結(jié)構(gòu)類似于圖像,通過(guò)數(shù)據(jù)及圖像的不同排列組合訓(xùn)練,AI就能實(shí)現(xiàn)自生成。
在業(yè)內(nèi),這一邏輯也被稱為AIGP,即AI Generated Protein(AI生成蛋白質(zhì))。
在天壤XLab,記者看到了相關(guān)應(yīng)用:
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
去年10月,具備該功能的xCREATOR工作臺(tái)正式上線,面向高校師生免費(fèi)開放;今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也正式上線。
“我們還附加了一系列設(shè)計(jì)蛋白質(zhì)的分析功能,可以對(duì)各類由算法自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)進(jìn)行打分,分?jǐn)?shù)越高表示該自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)的可實(shí)現(xiàn)性越高?!碧烊繶Lab實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士介紹稱。
在人工智能中,需要人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、打分,以此來(lái)訓(xùn)練算法更會(huì)聊天;AIGP也是類似的邏輯,但不同的是,如果科研人員要想知道某一由算法自動(dòng)生成的蛋白質(zhì),其可實(shí)現(xiàn)性到底高不高,還需要通過(guò)進(jìn)一步的濕實(shí)驗(yàn)來(lái)驗(yàn)證,因此,AIGP的技術(shù)壁壘也就更高。
為了降低這一技術(shù)門檻,引入打分模型算法是很多企業(yè)的選擇。
前述行業(yè)企業(yè)對(duì)《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步解釋了生成算法與打分算法的工作邏輯:第一,由生成模型算法生成蛋白質(zhì);第三,由人工對(duì)經(jīng)打分模型篩選出的、得分較高的蛋白質(zhì),再進(jìn)行實(shí)驗(yàn)驗(yàn)證,并反饋給打分模型算法。“二者就像老頑童的左右兩手互搏,通過(guò)不斷增強(qiáng)學(xué)習(xí),來(lái)提高算法的質(zhì)量。”
▌探索大分子宇宙
有了AIGP,對(duì)于科研人員來(lái)說(shuō),最大的獲益無(wú)疑是加速了研發(fā)的進(jìn)展。
“以100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)為例,其序列的排列組合有高達(dá)20^100=1.3×10^130種可能!相比之下,人類可觀測(cè)宇宙總原子數(shù)量?jī)H有10^82,以人力來(lái)測(cè)試、構(gòu)想這樣龐大的蛋白質(zhì)空間可以說(shuō)是不可能完成的任務(wù)?!泵绾榻Q,如今AI模型能夠精準(zhǔn)**到符合要求的蛋白質(zhì)再由研發(fā)人員進(jìn)行實(shí)驗(yàn)檢驗(yàn),蛋白質(zhì)設(shè)計(jì)效率前所未有的提升使其終于可以走進(jìn)產(chǎn)業(yè)應(yīng)用中去。
更重要的是,過(guò)去基于偶然性的開發(fā)工作也極大限制了人類對(duì)于蛋白質(zhì)的開發(fā),人類已知的天然蛋白質(zhì)數(shù)量為10^15,而潛在的從頭設(shè)計(jì)蛋白質(zhì)數(shù)量遠(yuǎn)超于已知天然蛋白質(zhì)。
以人體內(nèi)的蛋白質(zhì)來(lái)說(shuō),“目前大多數(shù)人類蛋白質(zhì)功能研究都聚焦于約5000種研究較多的人類蛋白質(zhì),而人體內(nèi)還存在著一個(gè)巨大的蛋白質(zhì)世界。事實(shí)上,這些功能未知的蛋白質(zhì)可能掌握著打開解決人類重大疾病的鑰匙,如癌癥、阿爾茲海默癥以及多種罕見病?!泵绮┦拷忉尫Q。
除生命科學(xué)外,新材料、新能源和食品等領(lǐng)域?qū)δ艿鞍踪|(zhì)也存有巨大的需求?!罢麄€(gè)蛋白質(zhì)世界還擁有巨大的潛在探索空間,蘊(yùn)藏著無(wú)窮無(wú)盡的資源,具有極大應(yīng)用價(jià)值!”天壤CEO薛貴榮博士表示,蛋白質(zhì)領(lǐng)域的人工智能會(huì)成為像水、電、煤一樣成為工業(yè)發(fā)展支撐,開辟出全新的科學(xué)時(shí)代。
《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步了解到,如何獲取行業(yè)數(shù)據(jù)、如何通過(guò)實(shí)驗(yàn)驗(yàn)證來(lái)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注進(jìn)而得到高質(zhì)量的反饋數(shù)據(jù)仍然是限制AIGP大爆發(fā)的主要攔路虎?;诖?,開源共享仍是目前行業(yè)企業(yè)們的主要選擇。
本文由小編網(wǎng)絡(luò)轉(zhuǎn)載而成,原文來(lái)源:http://www.techweb.com.cn/it/2023-03-07/2921802.shtml,如有侵權(quán),請(qǐng)聯(lián)系刪除
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
這是記者在天壤XLab看到的相關(guān)應(yīng)用。
2022年10月,天壤XLab上線了蛋白質(zhì)自由設(shè)計(jì)平臺(tái)xCREATOR,面向高校師生免費(fèi)開放,不足半年,該平臺(tái)已累積有五六百用戶。日前,《科創(chuàng)板日?qǐng)?bào)》記者從天壤XLab處進(jìn)一步了解到,今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也已正式上線。
支撐這些平臺(tái)的技術(shù)就是蛋白質(zhì)結(jié)構(gòu)的自動(dòng)生成技術(shù),后者也是人工智能的核心技術(shù)之一。另有跡象表明,自動(dòng)生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用正在逐漸增多:
今年2月,科創(chuàng)板合成生物學(xué)上市公司凱賽生物宣布領(lǐng)投AI蛋白質(zhì)設(shè)計(jì)平臺(tái)公司分子之心的新一輪戰(zhàn)略投資;同在2月,初創(chuàng)企業(yè)賽得康宣布完成了數(shù)千萬(wàn)元的種子輪融資,AI設(shè)計(jì)+蛋白模塊是企業(yè)的關(guān)鍵詞。
“其實(shí),人工智能所依托的AI生成技術(shù)并非新技術(shù),很多公司都已經(jīng)有所積累并陸續(xù)開始應(yīng)用了。之前有個(gè)語(yǔ)言模型BERT就被用于蛋白質(zhì)生成了,取得了不錯(cuò)的成果?!币患倚袠I(yè)企業(yè)對(duì)記者表示,只不過(guò),當(dāng)人工智能走熱之后,AI生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用也逐漸走進(jìn)了公眾的視野。
記者注意到,當(dāng)互聯(lián)網(wǎng)科技向AI迭代升級(jí)后,很快,AI的應(yīng)用就從TMT涌向了生物醫(yī)藥,AI+藥物發(fā)現(xiàn)一度成為一級(jí)市場(chǎng)的投資熱詞;類似的情況,會(huì)不會(huì)也發(fā)生在人工智能+藥物發(fā)現(xiàn)上呢?
▌氨基酸恰類似于大數(shù)據(jù)
記者了解到,自動(dòng)生成技術(shù)之所以可應(yīng)用到蛋白質(zhì)的發(fā)現(xiàn)上,有這樣的科學(xué)邏輯支撐:
蛋白質(zhì)是由氨基酸通過(guò)不同的排列組合聚合而成,每個(gè)蛋白質(zhì)的三維結(jié)構(gòu)又決定了它的功能作用。在算法人的眼中,氨基酸就類似于數(shù)據(jù)、蛋白質(zhì)的三維結(jié)構(gòu)類似于圖像,通過(guò)數(shù)據(jù)及圖像的不同排列組合訓(xùn)練,AI就能實(shí)現(xiàn)自生成。
在業(yè)內(nèi),這一邏輯也被稱為AIGP,即AI Generated Protein(AI生成蛋白質(zhì))。
在天壤XLab,記者看到了相關(guān)應(yīng)用:
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
去年10月,具備該功能的xCREATOR工作臺(tái)正式上線,面向高校師生免費(fèi)開放;今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也正式上線。
“我們還附加了一系列設(shè)計(jì)蛋白質(zhì)的分析功能,可以對(duì)各類由算法自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)進(jìn)行打分,分?jǐn)?shù)越高表示該自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)的可實(shí)現(xiàn)性越高。”天壤XLab實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士介紹稱。
在人工智能中,需要人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、打分,以此來(lái)訓(xùn)練算法更會(huì)聊天;AIGP也是類似的邏輯,但不同的是,如果科研人員要想知道某一由算法自動(dòng)生成的蛋白質(zhì),其可實(shí)現(xiàn)性到底高不高,還需要通過(guò)進(jìn)一步的濕實(shí)驗(yàn)來(lái)驗(yàn)證,因此,AIGP的技術(shù)壁壘也就更高。
為了降低這一技術(shù)門檻,引入打分模型算法是很多企業(yè)的選擇。
前述行業(yè)企業(yè)對(duì)《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步解釋了生成算法與打分算法的工作邏輯:第一,由生成模型算法生成蛋白質(zhì);第三,由人工對(duì)經(jīng)打分模型篩選出的、得分較高的蛋白質(zhì),再進(jìn)行實(shí)驗(yàn)驗(yàn)證,并反饋給打分模型算法?!岸呔拖窭项B童的左右兩手互搏,通過(guò)不斷增強(qiáng)學(xué)習(xí),來(lái)提高算法的質(zhì)量?!?/p>
▌探索大分子宇宙
有了AIGP,對(duì)于科研人員來(lái)說(shuō),最大的獲益無(wú)疑是加速了研發(fā)的進(jìn)展。
“以100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)為例,其序列的排列組合有高達(dá)20^100=1.3×10^130種可能!相比之下,人類可觀測(cè)宇宙總原子數(shù)量?jī)H有10^82,以人力來(lái)測(cè)試、構(gòu)想這樣龐大的蛋白質(zhì)空間可以說(shuō)是不可能完成的任務(wù)?!泵绾榻Q,如今AI模型能夠精準(zhǔn)**到符合要求的蛋白質(zhì)再由研發(fā)人員進(jìn)行實(shí)驗(yàn)檢驗(yàn),蛋白質(zhì)設(shè)計(jì)效率前所未有的提升使其終于可以走進(jìn)產(chǎn)業(yè)應(yīng)用中去。
更重要的是,過(guò)去基于偶然性的開發(fā)工作也極大限制了人類對(duì)于蛋白質(zhì)的開發(fā),人類已知的天然蛋白質(zhì)數(shù)量為10^15,而潛在的從頭設(shè)計(jì)蛋白質(zhì)數(shù)量遠(yuǎn)超于已知天然蛋白質(zhì)。
以人體內(nèi)的蛋白質(zhì)來(lái)說(shuō),“目前大多數(shù)人類蛋白質(zhì)功能研究都聚焦于約5000種研究較多的人類蛋白質(zhì),而人體內(nèi)還存在著一個(gè)巨大的蛋白質(zhì)世界。事實(shí)上,這些功能未知的蛋白質(zhì)可能掌握著打開解決人類重大疾病的鑰匙,如癌癥、阿爾茲海默癥以及多種罕見病?!泵绮┦拷忉尫Q。
除生命科學(xué)外,新材料、新能源和食品等領(lǐng)域?qū)δ艿鞍踪|(zhì)也存有巨大的需求?!罢麄€(gè)蛋白質(zhì)世界還擁有巨大的潛在探索空間,蘊(yùn)藏著無(wú)窮無(wú)盡的資源,具有極大應(yīng)用價(jià)值!”天壤CEO薛貴榮博士表示,蛋白質(zhì)領(lǐng)域的人工智能會(huì)成為像水、電、煤一樣成為工業(yè)發(fā)展支撐,開辟出全新的科學(xué)時(shí)代。
《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步了解到,如何獲取行業(yè)數(shù)據(jù)、如何通過(guò)實(shí)驗(yàn)驗(yàn)證來(lái)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注進(jìn)而得到高質(zhì)量的反饋數(shù)據(jù)仍然是限制AIGP大爆發(fā)的主要攔路虎?;诖?,開源共享仍是目前行業(yè)企業(yè)們的主要選擇。
本文由小編網(wǎng)絡(luò)轉(zhuǎn)載而成,原文來(lái)源:http://www.techweb.com.cn/it/2023-03-07/2921802.shtml,如有侵權(quán),請(qǐng)聯(lián)系刪除
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
這是記者在天壤XLab看到的相關(guān)應(yīng)用。
2022年10月,天壤XLab上線了蛋白質(zhì)自由設(shè)計(jì)平臺(tái)xCREATOR,面向高校師生免費(fèi)開放,不足半年,該平臺(tái)已累積有五六百用戶。日前,《科創(chuàng)板日?qǐng)?bào)》記者從天壤XLab處進(jìn)一步了解到,今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也已正式上線。
支撐這些平臺(tái)的技術(shù)就是蛋白質(zhì)結(jié)構(gòu)的自動(dòng)生成技術(shù),后者也是人工智能的核心技術(shù)之一。另有跡象表明,自動(dòng)生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用正在逐漸增多:
今年2月,科創(chuàng)板合成生物學(xué)上市公司凱賽生物宣布領(lǐng)投AI蛋白質(zhì)設(shè)計(jì)平臺(tái)公司分子之心的新一輪戰(zhàn)略投資;同在2月,初創(chuàng)企業(yè)賽得康宣布完成了數(shù)千萬(wàn)元的種子輪融資,AI設(shè)計(jì)+蛋白模塊是企業(yè)的關(guān)鍵詞。
“其實(shí),人工智能所依托的AI生成技術(shù)并非新技術(shù),很多公司都已經(jīng)有所積累并陸續(xù)開始應(yīng)用了。之前有個(gè)語(yǔ)言模型BERT就被用于蛋白質(zhì)生成了,取得了不錯(cuò)的成果?!币患倚袠I(yè)企業(yè)對(duì)記者表示,只不過(guò),當(dāng)人工智能走熱之后,AI生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用也逐漸走進(jìn)了公眾的視野。
記者注意到,當(dāng)互聯(lián)網(wǎng)科技向AI迭代升級(jí)后,很快,AI的應(yīng)用就從TMT涌向了生物醫(yī)藥,AI+藥物發(fā)現(xiàn)一度成為一級(jí)市場(chǎng)的投資熱詞;類似的情況,會(huì)不會(huì)也發(fā)生在人工智能+藥物發(fā)現(xiàn)上呢?
▌氨基酸恰類似于大數(shù)據(jù)
記者了解到,自動(dòng)生成技術(shù)之所以可應(yīng)用到蛋白質(zhì)的發(fā)現(xiàn)上,有這樣的科學(xué)邏輯支撐:
蛋白質(zhì)是由氨基酸通過(guò)不同的排列組合聚合而成,每個(gè)蛋白質(zhì)的三維結(jié)構(gòu)又決定了它的功能作用。在算法人的眼中,氨基酸就類似于數(shù)據(jù)、蛋白質(zhì)的三維結(jié)構(gòu)類似于圖像,通過(guò)數(shù)據(jù)及圖像的不同排列組合訓(xùn)練,AI就能實(shí)現(xiàn)自生成。
在業(yè)內(nèi),這一邏輯也被稱為AIGP,即AI Generated Protein(AI生成蛋白質(zhì))。
在天壤XLab,記者看到了相關(guān)應(yīng)用:
在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。
去年10月,具備該功能的xCREATOR工作臺(tái)正式上線,面向高校師生免費(fèi)開放;今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也正式上線。
“我們還附加了一系列設(shè)計(jì)蛋白質(zhì)的分析功能,可以對(duì)各類由算法自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)進(jìn)行打分,分?jǐn)?shù)越高表示該自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)的可實(shí)現(xiàn)性越高?!碧烊繶Lab實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士介紹稱。
在人工智能中,需要人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、打分,以此來(lái)訓(xùn)練算法更會(huì)聊天;AIGP也是類似的邏輯,但不同的是,如果科研人員要想知道某一由算法自動(dòng)生成的蛋白質(zhì),其可實(shí)現(xiàn)性到底高不高,還需要通過(guò)進(jìn)一步的濕實(shí)驗(yàn)來(lái)驗(yàn)證,因此,AIGP的技術(shù)壁壘也就更高。
為了降低這一技術(shù)門檻,引入打分模型算法是很多企業(yè)的選擇。
前述行業(yè)企業(yè)對(duì)《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步解釋了生成算法與打分算法的工作邏輯:第一,由生成模型算法生成蛋白質(zhì);第三,由人工對(duì)經(jīng)打分模型篩選出的、得分較高的蛋白質(zhì),再進(jìn)行實(shí)驗(yàn)驗(yàn)證,并反饋給打分模型算法?!岸呔拖窭项B童的左右兩手互搏,通過(guò)不斷增強(qiáng)學(xué)習(xí),來(lái)提高算法的質(zhì)量。”
▌探索大分子宇宙
有了AIGP,對(duì)于科研人員來(lái)說(shuō),最大的獲益無(wú)疑是加速了研發(fā)的進(jìn)展。
“以100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)為例,其序列的排列組合有高達(dá)20^100=1.3×10^130種可能!相比之下,人類可觀測(cè)宇宙總原子數(shù)量?jī)H有10^82,以人力來(lái)測(cè)試、構(gòu)想這樣龐大的蛋白質(zhì)空間可以說(shuō)是不可能完成的任務(wù)?!泵绾榻Q,如今AI模型能夠精準(zhǔn)**到符合要求的蛋白質(zhì)再由研發(fā)人員進(jìn)行實(shí)驗(yàn)檢驗(yàn),蛋白質(zhì)設(shè)計(jì)效率前所未有的提升使其終于可以走進(jìn)產(chǎn)業(yè)應(yīng)用中去。
更重要的是,過(guò)去基于偶然性的開發(fā)工作也極大限制了人類對(duì)于蛋白質(zhì)的開發(fā),人類已知的天然蛋白質(zhì)數(shù)量為10^15,而潛在的從頭設(shè)計(jì)蛋白質(zhì)數(shù)量遠(yuǎn)超于已知天然蛋白質(zhì)。
以人體內(nèi)的蛋白質(zhì)來(lái)說(shuō),“目前大多數(shù)人類蛋白質(zhì)功能研究都聚焦于約5000種研究較多的人類蛋白質(zhì),而人體內(nèi)還存在著一個(gè)巨大的蛋白質(zhì)世界。事實(shí)上,這些功能未知的蛋白質(zhì)可能掌握著打開解決人類重大疾病的鑰匙,如癌癥、阿爾茲海默癥以及多種罕見病。”苗博士解釋稱。
除生命科學(xué)外,新材料、新能源和食品等領(lǐng)域?qū)δ艿鞍踪|(zhì)也存有巨大的需求?!罢麄€(gè)蛋白質(zhì)世界還擁有巨大的潛在探索空間,蘊(yùn)藏著無(wú)窮無(wú)盡的資源,具有極大應(yīng)用價(jià)值!”天壤CEO薛貴榮博士表示,蛋白質(zhì)領(lǐng)域的人工智能會(huì)成為像水、電、煤一樣成為工業(yè)發(fā)展支撐,開辟出全新的科學(xué)時(shí)代。
《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步了解到,如何獲取行業(yè)數(shù)據(jù)、如何通過(guò)實(shí)驗(yàn)驗(yàn)證來(lái)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注進(jìn)而得到高質(zhì)量的反饋數(shù)據(jù)仍然是限制AIGP大爆發(fā)的主要攔路虎?;诖?,開源共享仍是目前行業(yè)企業(yè)們的主要選擇。
本文由小編網(wǎng)絡(luò)轉(zhuǎn)載而成,原文來(lái)源:http://www.techweb.com.cn/it/2023-03-07/2921802.shtml,如有侵權(quán),請(qǐng)聯(lián)系刪除
]]>