在生命科學(xué)、深度學(xué)習(xí)、冷凍電鏡、細(xì)胞治療、分子模擬、蛋白質(zhì)組學(xué)、疾病建模、靶點(diǎn)識(shí)別、藥物設(shè)計(jì)、AlphaFold的飛速發(fā)展下,中國醫(yī)藥研發(fā)領(lǐng)域、小分子研究領(lǐng)域得到飛速發(fā)展,已經(jīng)成為全球第二大市場。
醫(yī)藥研發(fā)現(xiàn)狀及未來發(fā)展趨勢
我國生物醫(yī)藥研發(fā)支出累計(jì)環(huán)比增長
隨著醫(yī)改的穩(wěn)步推進(jìn),傳統(tǒng)的以銷售為導(dǎo)向的擴(kuò)張模式難以為繼,國內(nèi)藥企面臨創(chuàng)新轉(zhuǎn)型。從2016年到2020年,生物醫(yī)藥上市公司的研發(fā)投入將繼續(xù)擴(kuò)大。2020年,我國生物醫(yī)藥上市公司研發(fā)支出達(dá)到115.34億元,同比增長37.10%。2021年上半年,我國生物醫(yī)藥上市公司研發(fā)支出已達(dá)69.78億元,預(yù)計(jì)全年研發(fā)支出將進(jìn)一步增加??傮w來看,研發(fā)投入力度的增加將在一定程度上幫助企業(yè)加快生物醫(yī)藥產(chǎn)品的研究成果轉(zhuǎn)化。
我國新藥申請上市情況樂觀,新產(chǎn)品研發(fā)活躍
從轉(zhuǎn)化結(jié)果來看,我國新藥上市情況樂觀。2017-2020年,國內(nèi)新藥申請上市數(shù)量呈波動(dòng)趨勢,2018年達(dá)到峰值45件。2019年,藥審中心受理國內(nèi)一類創(chuàng)新藥上市申請25個(gè)(16個(gè)品種),2020年上市申請43個(gè)。
創(chuàng)新藥物是指由企業(yè)或研究機(jī)構(gòu)原創(chuàng),具有新的化學(xué)結(jié)構(gòu)和新的治療用途,并擁有自主知識(shí)產(chǎn)權(quán)專利的藥物。對(duì)特定疾病有顯著療效,提高治療率,延長患者生存期。在活動(dòng)方面,國內(nèi)生物制藥公司在研發(fā)活動(dòng)中活躍。由于2020年新冠肺炎疫情爆發(fā),有三家制藥公司已在新冠肺炎研發(fā)投資疫苗和檢測試劑。此外,另有藥企以人用疫苗和免疫球蛋白為主要研究方向。
我國創(chuàng)新藥物研究發(fā)展能力較強(qiáng),投入及產(chǎn)出需改善
盡管中國生物醫(yī)藥產(chǎn)業(yè)研發(fā)投資和成果轉(zhuǎn)化較好,但與發(fā)達(dá)國家相比,中國創(chuàng)新藥物研發(fā)在許多指標(biāo)上仍有待提高。在研發(fā)投入能力和產(chǎn)出方面,中國與發(fā)達(dá)國家存在一定差距。即使與水平相當(dāng)?shù)挠《认啾?,新藥研發(fā)投入也有一定差距。目前,我國政府越來越重視自主知識(shí)產(chǎn)權(quán)創(chuàng)新藥物的研發(fā),并出臺(tái)了一系列激勵(lì)政策,取得了一定的成效。但是,為了不斷提高我國創(chuàng)新藥物的研發(fā)能力,我國政府應(yīng)不斷調(diào)整和完善相關(guān)政策,為我國醫(yī)藥企業(yè)創(chuàng)新藥物研發(fā)創(chuàng)造良好的政策環(huán)境。
我國創(chuàng)新藥物研發(fā)趨勢
雖然中國創(chuàng)新藥物的研發(fā)水平與世界領(lǐng)先國家相比還有很大差距,但未來,鑒于中國醫(yī)藥外包行業(yè)在世界上的領(lǐng)先地位和巨大的市場,中國有實(shí)力成為全球藥物創(chuàng)新中心,并且隨著新冠肺炎疫苗在國際上的日益普及,國家規(guī)劃對(duì)生物醫(yī)藥的高度重視,中國生物醫(yī)藥行業(yè)藥物研發(fā)未來可期。
AI技術(shù)為藥物研發(fā)帶來的變革與突破
在海量的知識(shí)點(diǎn)中,如何全面地尋找和評(píng)價(jià)決定性的關(guān)系和鏈接,如何建立相互作用,或者是推測關(guān)鍵待發(fā)現(xiàn)的知識(shí)點(diǎn)?從這個(gè)角度來看,人為學(xué)習(xí)的效率顯然是很低的。而AI從底層上來講,如果人工智能做到整個(gè)知識(shí)圖譜邏輯性的建立,AI去搜尋答案肯定比人為要強(qiáng)很多,并且AI具有搜尋地更全面更深入的優(yōu)點(diǎn)。
藥物開發(fā)的各階段中,前期的基于疾病機(jī)理的靶點(diǎn)發(fā)現(xiàn)、生物標(biāo)志物的發(fā)現(xiàn)、后期的臨床試驗(yàn)設(shè)計(jì)、療效預(yù)測,目前都還基本處于數(shù)據(jù)收集分析,或者說大數(shù)據(jù)的時(shí)代。
由于缺乏足夠的經(jīng)過驗(yàn)證的結(jié)果,以及前期相對(duì)應(yīng)的關(guān)聯(lián)數(shù)據(jù),所以深度學(xué)習(xí)在缺乏足夠的數(shù)據(jù)和前期的成功的經(jīng)過驗(yàn)證的邏輯關(guān)系等限制條件下,還需要更多試驗(yàn)數(shù)據(jù)和人本身認(rèn)知的進(jìn)步才有機(jī)會(huì)逐漸成熟。
但AI在某些臨床實(shí)踐中,諸如病理分析判斷等環(huán)節(jié)上應(yīng)用的比較成功,也是因?yàn)榉e累了足夠多的數(shù)據(jù)和病理醫(yī)生的實(shí)踐經(jīng)驗(yàn)。但是從藥物開發(fā)的臨床設(shè)計(jì)和試驗(yàn)數(shù)據(jù)收集環(huán)節(jié)來看,AI還沒到那個(gè)真正能突破的階段。相信未來隨著更多的臨床數(shù)據(jù)、大數(shù)據(jù)共享的普及,AI算法能夠脫穎而出。
就目前來看,人工智能在藥物設(shè)計(jì)上,尤其是小分子,甚至大分子藥物設(shè)計(jì)上存在機(jī)遇。當(dāng)然在蛋白藥物開發(fā)也存在一定的機(jī)遇,比如前一段時(shí)間AlphaFold出來之后,為蛋白序列、結(jié)構(gòu)、蛋白質(zhì)間的相互作用的研究提供了海量數(shù)據(jù),隨著相關(guān)內(nèi)在邏輯的理解逐漸深入,為AI驅(qū)動(dòng)的深度學(xué)習(xí)提供了機(jī)會(huì),將有可能真正實(shí)現(xiàn)突破。
在醫(yī)藥領(lǐng)域里,AI遇到的瓶頸
一、認(rèn)知的局限和數(shù)據(jù)的質(zhì)量
突破認(rèn)知局限是更有挑戰(zhàn)的,高質(zhì)量的數(shù)據(jù)可以通過聚焦的投入去生成。
二、人們對(duì)AI應(yīng)用的理解
人需要理解規(guī)則,輸入輸出端一定的內(nèi)在邏輯聯(lián)系,才能創(chuàng)造出好的AI應(yīng)用。就像下棋,要打很多經(jīng)典的棋譜才能做出AlphaGo。
目前醫(yī)療領(lǐng)域前期的開發(fā)和后期的臨床數(shù)據(jù)解讀,都還不完善。但是在小分子和大分子結(jié)構(gòu)及性質(zhì)的數(shù)據(jù)上已經(jīng)有了一定的積累,對(duì)分子序列,結(jié)構(gòu)與一些分子特征,比如:親和力,成藥性等之間相互如何關(guān)聯(lián)的,AI對(duì)此如果有一定的認(rèn)識(shí)將大有可為。
三、算法算力存在偏差
大公司很難釋放臨床數(shù)據(jù),AI只是用現(xiàn)有的數(shù)據(jù)進(jìn)行測算,這時(shí)數(shù)據(jù)大小和量會(huì)有限制。
四、數(shù)據(jù)樣本少
做臨床沒有太多的數(shù)據(jù),做臨床一期也就是60位病人,二期200位病人,數(shù)據(jù)是非常有限的。無法使用有限的數(shù)據(jù)得到正確答案,這也是AI遇到的難題。
冷凍電鏡助力藥物研發(fā)
一直以來,科學(xué)家們都在探索基礎(chǔ)生命科學(xué),探索細(xì)胞中的生命規(guī)律,為人類健康和其他學(xué)科提供參考。分子是生命中最小的單位,生命科學(xué)研究逐漸發(fā)展到微觀生物分子的結(jié)構(gòu)和功能的研究階段,以逐步加深對(duì)生命過程的認(rèn)知。充足的基礎(chǔ)研究不僅可以幫助我們深入了解生命過程,還有助于改善人類健康和生活質(zhì)量??茖W(xué)家可以通過生命科學(xué)研究幫助識(shí)別新藥靶點(diǎn),并根據(jù)靶點(diǎn)進(jìn)行藥物篩選,從而提高藥物研究的成功率、安全性和有效性。隨著生物制品,特別是抗體大分子的發(fā)展,冷凍電子顯微鏡越來越多地用于分析活性生物分子的結(jié)構(gòu)。
冷凍電子顯微鏡用于分析生物樣品的三維結(jié)構(gòu),包括單顆粒分析、微晶電子衍射和冷凍電子斷層掃描。冷凍電鏡單顆粒分析技術(shù)Cryo-EM SPA是一種以單個(gè)粒子形式分析生物分子組裝的新方法。通過快速冷凍負(fù)染電鏡獲得的適當(dāng)濃度的生物分子樣品,生物大分子以近自然狀態(tài)存在于無定形冰中,然后對(duì)冷凍樣品進(jìn)行篩選、數(shù)據(jù)采集和三維結(jié)構(gòu)分析,獲得高分辨率的生物分子結(jié)構(gòu)。其工作過程如圖。
冷凍電鏡單粒子分析技術(shù)可以在分子水平進(jìn)行細(xì)致的研究,分析基于結(jié)構(gòu)的藥物研發(fā)的分子基礎(chǔ),而冷凍電子斷層成像技術(shù)可以在亞細(xì)胞水平觀察原位細(xì)胞環(huán)境中靶分子的作用位點(diǎn)和作用機(jī)制,相信在不久的將來可以用于進(jìn)一步確認(rèn)基于結(jié)構(gòu)的藥物研發(fā)的可靠性。電子衍射不僅可以分析小分子的微晶結(jié)構(gòu),還可以補(bǔ)充現(xiàn)有技術(shù)分析生物大分子及其化合物的微晶結(jié)構(gòu)。
分子生物學(xué)興起后,靶向藥物發(fā)現(xiàn)逐漸成為主流的新藥研發(fā)模式。靶點(diǎn)-受體相互作用的靶和結(jié)合位點(diǎn)通常通過結(jié)構(gòu)生物學(xué)方法獲得。以目標(biāo)結(jié)構(gòu)和結(jié)合位點(diǎn)為模型進(jìn)行虛擬篩選,通過高通量方法獲得可能結(jié)合的潛在分子。此外,通過結(jié)構(gòu)生物學(xué)方法直接分析目標(biāo)潛在分子的高分辨率結(jié)構(gòu),并確認(rèn)潛在分子。2014年,低溫電子顯微鏡的“分辨率革命”使其成為獲得3種以上結(jié)構(gòu)的常規(guī)技術(shù)。高分辨率的結(jié)構(gòu)可以清晰地描述靶分子和潛在分子之間相互作用的信息,包括結(jié)合表位、配體手性等。為潛在化合物的結(jié)構(gòu)改造提供指導(dǎo)。
新的疾病或流行病爆發(fā)需要從頭進(jìn)行藥物設(shè)計(jì)研究,而這些反應(yīng)靈敏的藥物研發(fā)需要大量基礎(chǔ)研究的積累。冷凍電鏡技術(shù)不僅非常適合結(jié)構(gòu)生物學(xué)的基礎(chǔ)研究,而且有助于加速結(jié)構(gòu)藥物的研發(fā)。例如,在2020年新冠肺炎疫情期間,德克薩斯大學(xué)奧斯汀分校的Jason S. McLellan課題組和西湖大學(xué)的周強(qiáng)課題組先后分析了新型冠狀病毒跨膜刺突蛋白在膜融合前的細(xì)胞外結(jié)構(gòu)域的三維結(jié)構(gòu)和人類受體全長血管緊張素轉(zhuǎn)換酶2(ACE2)蛋白-新型冠狀病毒刺突蛋白復(fù)合物的近原子分辨率結(jié)構(gòu)。不僅闡明了病毒感染人體的機(jī)制,而且促進(jìn)了基于結(jié)構(gòu)研究的合理疫苗設(shè)計(jì)和藥物研發(fā),篩選出針對(duì)刺突蛋白的中和抗體候選物和重組疫苗候選物。
近年來,冷凍電鏡技術(shù)已被全世界公眾所熟知,并被越來越多的學(xué)術(shù)界和跨國制藥企業(yè)所采用。在藥物研發(fā)方面,許多跨國公司已經(jīng)使用冷凍電子顯微鏡技術(shù)進(jìn)行藥物研發(fā)。
雖然冷凍電鏡是一項(xiàng)前沿技術(shù),但目前冷凍電鏡基于其結(jié)構(gòu)研發(fā)的一些藥物已經(jīng)進(jìn)入臨床試驗(yàn)階段。比如葛蘭素史克公司針對(duì)關(guān)鍵寄生蟲酶研發(fā)的新型黑熱病抑制劑,再生元制藥公司針對(duì)新冠肺炎研發(fā)的抗體“雞尾酒”,都已經(jīng)進(jìn)入臨床試驗(yàn)階段。相信冷凍電鏡除了應(yīng)用于基礎(chǔ)研究之外,還將越來越多地應(yīng)用于藥物開發(fā)等其他研究領(lǐng)域,為人類健康做出貢獻(xiàn)。
冷凍電鏡未來的探索
冷凍電鏡技術(shù)在藥物研發(fā)過程中的應(yīng)用實(shí)例進(jìn)一步表明,該技術(shù)在藥物(生物制品)質(zhì)量方面具有前瞻性意義。在回顧該技術(shù)應(yīng)用的同時(shí),我們也看到了冷凍電鏡在未來新藥研發(fā)中的發(fā)展方向。我們相信,冷凍電子顯微鏡將在基于結(jié)構(gòu)的藥物設(shè)計(jì)、生物制劑的高級(jí)結(jié)構(gòu)表征和冷鏈運(yùn)輸過程中的質(zhì)量控制中發(fā)揮越來越重要的作用。
藍(lán)海大腦助力藥物研發(fā)
案例概述
清華大學(xué)藥學(xué)院初始于2021年,藥物分子研發(fā)是一個(gè)非常復(fù)雜且非常耗時(shí)的過程,藥物分子篩選只是前期流程中的一個(gè)環(huán)節(jié)。如尋找跟蛋白病毒酶結(jié)合的小分子,由于存在不同種類或研究機(jī)構(gòu)的配體(小分子)庫,配體(小分子)庫數(shù)量巨大,每個(gè)配體庫的配體數(shù)量成千上萬(甚至更大),通過實(shí)驗(yàn)方式測試驗(yàn)證是不切實(shí)際的。通過計(jì)算機(jī)數(shù)值模擬進(jìn)行篩選,對(duì)不同配體的結(jié)合效果進(jìn)行打分,篩選出分?jǐn)?shù)高且結(jié)合模式合理的一些配體作為候選藥物進(jìn)行實(shí)驗(yàn)驗(yàn)證,能夠有效的加速藥物研發(fā)進(jìn)程。
由于配體庫數(shù)量巨大,在有限時(shí)間內(nèi)完成篩選,同樣挑戰(zhàn)巨大。例如,配體庫有10000個(gè)候選配體,每個(gè)配體平均處理時(shí)間為1.5小時(shí),總共需要15000 個(gè)小時(shí)(625天)。因此,為在規(guī)定時(shí)間內(nèi)算完,需要具備以下條件:
一、擁有強(qiáng)大算力的計(jì)算平臺(tái);
二、大容量存儲(chǔ),用于存放處理數(shù)據(jù)和計(jì)算結(jié)果;
此外,為了保證篩選計(jì)算能夠高效、順利完成,還需要計(jì)算服務(wù),包括:
一、集群軟件運(yùn)行環(huán)境,保證在多機(jī)環(huán)境軟件下運(yùn)行,以及數(shù)據(jù)訪問;
二、能夠支持多任務(wù)在多機(jī)環(huán)境下并發(fā)處理的并行方案。
除計(jì)算平臺(tái)外,藥物篩選還需要高性能應(yīng)用軟件。藥物篩選模擬計(jì)算包括Docking和分子動(dòng)力學(xué)計(jì)算:其中Docking 耗時(shí)相對(duì)較小,常用于大量配體的初步篩選,主要軟件有dock6、Autodock Vina、Glide等。分子動(dòng)力學(xué)模擬計(jì)算比較耗時(shí),測試作用的時(shí)間變化,用于對(duì)Docking初選結(jié)果進(jìn)一步分析,主要軟件有Gromacs,Namd,Amber等,使用GPU加速效果一般比較明顯。
方案與價(jià)值
藥物小分子研發(fā)需要強(qiáng)大算力的高性能集群,獲取這些計(jì)算資源和服務(wù)成為當(dāng)下的重中之重。清華大學(xué)藥學(xué)院搭建了四臺(tái)A100液冷服務(wù)器、9臺(tái)CPU服務(wù)器、兩臺(tái)高通量液冷服務(wù)器,為高性能計(jì)算環(huán)境提供基礎(chǔ)的計(jì)算平臺(tái)。
使用DOCK6 處理配體(小分子)庫的對(duì)接案例時(shí),在一個(gè)文件夾中,如mol2,存放大量的小分子文件,每個(gè)小分子處理流程是一樣的,均需要與相同的受體(如病毒蛋白酶)進(jìn)行計(jì)算。這時(shí)需要在短時(shí)間內(nèi)提供大量GPU和超算產(chǎn)品,以及全天候的技術(shù)支持。搭建開放共享平臺(tái),使用高性能計(jì)算集群,用于藥物研發(fā)的分子對(duì)接、分子動(dòng)力學(xué)模擬、深度學(xué)習(xí)模型訓(xùn)練,把需要幾天的計(jì)算工作縮短到幾小時(shí),速度提升8到20倍。同時(shí)為各研發(fā)老師創(chuàng)建不同的子賬戶,實(shí)現(xiàn)計(jì)算資源共享和數(shù)據(jù)共享。為高性能計(jì)算環(huán)境提供基礎(chǔ)的計(jì)算平臺(tái),要實(shí)現(xiàn)高效的藥物篩選,還需要高通量任務(wù)解決方案。
總結(jié)
清華大學(xué)藥學(xué)院藥物研發(fā)需要強(qiáng)大算力的高性能計(jì)算集群,如藥物篩選需要進(jìn)行大量小分子的Docking處理。藥學(xué)院老師可以利用藍(lán)海大腦高性能液冷服務(wù)器,快速構(gòu)建高性能集群,獲取高性能的計(jì)算實(shí)例,滿足算力的需求。同時(shí)提供高通量任務(wù)處理的解決方案,使得藥物篩選在多計(jì)算節(jié)點(diǎn)、多核上并發(fā)處理,降低任務(wù)整體執(zhí)行時(shí)間。
審核編輯:符乾江
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238247 -
生命科學(xué)
+關(guān)注
關(guān)注
0文章
24瀏覽量
12335
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論