RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度進(jìn)軍生物計(jì)算領(lǐng)域 發(fā)布基于飛槳的生物計(jì)算平臺(tái) - 螺旋槳 PaddleHelix

工程師鄧生 ? 來(lái)源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2020-12-28 16:20 ? 次閱讀

百度正式發(fā)布基于飛槳的生物計(jì)算平臺(tái) - 螺旋槳 PaddleHelix,進(jìn)軍生物計(jì)算領(lǐng)域。

在本月 20 號(hào)召開的 WAVE SUMMIT+2020 深度學(xué)習(xí)開發(fā)者峰會(huì)上,百度正式發(fā)布了基于飛槳的生物計(jì)算平臺(tái) - 螺旋槳 PaddleHelix,進(jìn)軍生物計(jì)算領(lǐng)域。本次發(fā)布的螺旋槳 PaddleHelix 生物計(jì)算開源工具集,提供了包括 RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)、大規(guī)模的分子預(yù)訓(xùn)練、藥物 - 靶點(diǎn)親和力預(yù)測(cè)、以及 ADMET 成藥性預(yù)測(cè)等一系列算法和模型,重點(diǎn)滿足生物醫(yī)藥,疫苗設(shè)計(jì)和精準(zhǔn)醫(yī)療方面的 AI 需求。

螺旋槳 PaddleHelix 官網(wǎng)地址:https://www.paddlepaddle.org.cn/paddle/paddlehelix

螺旋槳 PaddleHelixGitHub 地址:https://github.com/PaddlePaddle/PaddleHelix

生物醫(yī)藥

在生物醫(yī)藥領(lǐng)域,小分子化合物的篩選是非常關(guān)鍵的環(huán)節(jié)。為了設(shè)計(jì)出某種疾病的特效藥,一方面要找到能夠和疾病靶點(diǎn)結(jié)合、具有足夠活性的小分子藥物;另一方面又要保證藥物在人體內(nèi)能夠正常發(fā)生作用,以及滿足一系列額外性質(zhì)(藥物的吸收,分布,代謝,排泄,毒性,統(tǒng)稱 ADMET)。

靶蛋白(Protein)- 藥物配體(Ligand)復(fù)合物 (來(lái)源:PDBBind-cn.org)

傳統(tǒng)的藥物發(fā)現(xiàn)方法包括基于靶點(diǎn)結(jié)構(gòu)的藥物設(shè)計(jì)(Structure Based Drug Design, SBDD),基于碎片的藥物設(shè)計(jì)(Fragment Based Drug Design, FBDD),老藥新用 (Repurposing),以及計(jì)算機(jī)虛擬藥物設(shè)計(jì)(Computational-Aided Drug Design, CADD)等等。這些方法均存在依賴體內(nèi)(in vivo)體外 (in vitro) 實(shí)驗(yàn)驗(yàn)證,或者消耗大量計(jì)算資源等問題。因此近年來(lái),基于分子的結(jié)構(gòu)和知識(shí)來(lái)直接預(yù)測(cè)親和性的 AI 藥物設(shè)計(jì)(AIDD)逐漸被廣泛認(rèn)可和應(yīng)用。相比于 CADD,AIDD 展現(xiàn)出了性能上的巨大優(yōu)勢(shì),但其效果同時(shí)受到生物計(jì)算領(lǐng)域數(shù)據(jù)量的限制。下面的表格(表 1)展示生物計(jì)算一些重要問題的典型數(shù)據(jù)量,其中綠色的是有標(biāo)注數(shù)據(jù)。我們看到,盡管這個(gè)領(lǐng)域有大量的無(wú)標(biāo)注數(shù)據(jù)(僅有分子結(jié)構(gòu)或者序列,沒有性質(zhì),或者次級(jí)結(jié)構(gòu)),有標(biāo)注數(shù)據(jù)卻非常少,難以支撐高質(zhì)量的深度模型。

表 1

在 AI 的其他領(lǐng)域也存在類似問題。以自然語(yǔ)言處理為例,這個(gè)領(lǐng)域存在 NER,邏輯推斷,閱讀理解,文本生成等等非常多的子問題。這些問題中的有標(biāo)注數(shù)據(jù)量都非常少。但是人類文明中累積了大量的無(wú)標(biāo)注語(yǔ)言文字,這些無(wú)標(biāo)注語(yǔ)料給自然語(yǔ)言處理提供了表示學(xué)習(xí)(Representation Learning)的機(jī)會(huì)。在這樣的背景下,BERT, ERNIE 等一系列基于自監(jiān)督(Self-Supervised)學(xué)習(xí)的方法被提出。

正是基于此,螺旋槳 PaddleHelix 提出基于表示學(xué)習(xí),多任務(wù)學(xué)習(xí)(Multi-Task Learning, MTL)和元學(xué)習(xí)(Meta Learning)來(lái)降低深度學(xué)習(xí)在生物計(jì)算中的技術(shù)和數(shù)據(jù)門檻,提升其效果。包括生物大分子(蛋白質(zhì),DNA,RNA)或者藥物小分子都由原子或者亞基組成,都可以通過(guò)序列,圖,或者三維結(jié)構(gòu)表示。一種自然的想法,是像在自然語(yǔ)言處理領(lǐng)域一樣,利用無(wú)標(biāo)注數(shù)據(jù)上的自監(jiān)督學(xué)習(xí)來(lái)優(yōu)化分子的表示,再將其應(yīng)用到下游任務(wù)。同時(shí),生物計(jì)算領(lǐng)域存在大量的零散的任務(wù),以 ADMET 為例,有 30~50 個(gè)指標(biāo)需要考慮。這樣的問題中,百度的生物計(jì)算團(tuán)隊(duì)也認(rèn)為多任務(wù)學(xué)習(xí)和元學(xué)習(xí)將會(huì)發(fā)揮重要作用。

螺旋槳 PaddleHelix 復(fù)現(xiàn)并內(nèi)置了業(yè)界主流的分子預(yù)訓(xùn)練模型(如表 2),以及常用的很多組網(wǎng)工具(CNN, Transformer, LSTM, ResNet,GNN 等等),開發(fā)者基于預(yù)訓(xùn)練模型實(shí)現(xiàn)自己的模型只需要短短幾行代碼。螺旋槳 PaddleHelix 也提供了一些通過(guò)了驗(yàn)證的,可以有效應(yīng)用于下游任務(wù)的模型,效果如表 2 所示。

表 2:使用預(yù)訓(xùn)練在分子性質(zhì)預(yù)測(cè)中帶來(lái)顯著提升

疫苗設(shè)計(jì)

疫苗是通過(guò)把病毒或病菌相關(guān)的抗原(通常是蛋白)預(yù)先輸入人體,引起人體免疫反應(yīng)的物質(zhì)。傳統(tǒng)的疫苗需要體外制備抗原蛋白,通常效率低,難于快速大規(guī)模生產(chǎn),因此可在人體自身內(nèi)生產(chǎn)抗原蛋白的 mRNA 疫苗受到越來(lái)越多的關(guān)注。mRNA 疫苗制備速度快、無(wú)感染風(fēng)險(xiǎn),但有一個(gè)天然劣勢(shì)就是 mRNA 非常不穩(wěn)定,這與 mRNA 的二級(jí)結(jié)構(gòu)相關(guān)。mRNA 疫苗設(shè)計(jì)的關(guān)鍵就在于,在不改變翻譯出的抗原蛋白的前提下,設(shè)計(jì) mRNA 序列使其二級(jí)結(jié)構(gòu)盡可能更穩(wěn)定。

mRNA 疫苗示意圖(來(lái)源:https://translate.bio/)

百度研究院生物計(jì)算團(tuán)隊(duì)從 2018 年開始就開展了 RNA 結(jié)構(gòu)預(yù)測(cè)和序列設(shè)計(jì)相關(guān)研究,并在 2019 年 7 月和 2020 年 7 月分別發(fā)表了 LinearFold 和 LinearPartition 算法, 將 RNA 結(jié)構(gòu)預(yù)測(cè)和分析的速度大大提升。其中 LinearFold 能夠在 27 秒內(nèi)完成新冠病毒全基因組結(jié)構(gòu)分析,比傳統(tǒng)算法速度提升 120 倍。正是有了之前的積累,百度研究院在短短兩個(gè)月就完成了 LinearDesign 的研發(fā), 在 mRNA 疫苗設(shè)計(jì)上提出了革命性的方法。LinearDesign 能夠在 11 分鐘內(nèi)完成新冠 mRNA 疫苗序列的設(shè)計(jì),設(shè)計(jì)序列的穩(wěn)定性和有效性大大提升。如圖所示,左邊是能翻譯新冠 S 蛋白的野生型 mRNA 二級(jí)結(jié)構(gòu),其中存在大量易斷裂的單鏈環(huán)。右邊是 LinearDesign 設(shè)計(jì)序列的結(jié)構(gòu),斷裂點(diǎn)更少,與野生型序列相比穩(wěn)定性大大提升。百度研究院 RNA 結(jié)構(gòu)預(yù)測(cè)與序列設(shè)計(jì)相關(guān)成果在美國(guó) MIT 科技評(píng)論,以及美國(guó)消費(fèi)者新聞與商業(yè)頻道(CNBC)得到了高度評(píng)價(jià),并在 2020 年全球人工智能峰會(huì)(AI Summit)上獲得了 AI For Good(AI 向善)獎(jiǎng)。

在螺旋槳 PaddleHelix 中,百度也完整開源了 LinearRNA 系列算法,目前主要包括 LinearFold 和 LinearPartition,開發(fā)者想要調(diào)用這些強(qiáng)大的工具僅僅需要一行代碼。

新冠 S 蛋白的野生型 mRNA 結(jié)構(gòu)和 LinearDesign 結(jié)構(gòu)

精準(zhǔn)醫(yī)療

精準(zhǔn)醫(yī)療(precision medicine)的概念是指,根據(jù)患者特征(patient characteristics)實(shí)現(xiàn)準(zhǔn)確的疾病診斷和分類,從而進(jìn)行個(gè)性化匹配用藥和跟蹤治療。相較于傳統(tǒng)的 one-size-fits-all 治療方案,精準(zhǔn)醫(yī)療致力于通過(guò)臨床數(shù)據(jù)、生活環(huán)境、特別是分子組學(xué)數(shù)據(jù)精確刻畫個(gè)體特征,通過(guò)挖掘和探究隱含在多模態(tài)數(shù)據(jù)層面的信息進(jìn)行綜合分析和判斷,最終提供更好更適配的藥物選擇和治療方案從而提升患者的治療效果最終提高個(gè)體的生存時(shí)間和生存質(zhì)量。

部分圖片素材來(lái)自網(wǎng)絡(luò)

螺旋槳 PaddleHelix 也將提供基于多維數(shù)據(jù)(臨床隨訪數(shù)據(jù)、蛋白組數(shù)據(jù)、基因組數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)、甲基化組數(shù)據(jù)、小 RNA 數(shù)據(jù)、單細(xì)胞組數(shù)據(jù))的表示學(xué)習(xí)算法模型、藥物響應(yīng)模型、疾病預(yù)后模型等,旨在幫助行業(yè)內(nèi)的醫(yī)療專家、研究人員和從業(yè)者更好的利用組學(xué)數(shù)據(jù)和分子特征更精確的刻畫個(gè)體表示做組群區(qū)分,從而在精準(zhǔn)醫(yī)療的三個(gè)維度預(yù)防、預(yù)測(cè)、治療(Prevention、Prediction、Treatment)構(gòu)建更好更準(zhǔn)確的醫(yī)療模型,幫助到更多的患者得到最好最適配的治療。

結(jié)語(yǔ)

在 WAVE SUMMIT+2020 深度學(xué)習(xí)開發(fā)者峰會(huì)上,百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室副主任,吳甜女士對(duì)螺旋槳 PaddleHelix 的發(fā)展做了簡(jiǎn)短的概述,希望未來(lái)與合作伙伴共建,逐步形成一套完整的面向行業(yè)的生物計(jì)算生態(tài)和服務(wù)。

我們也期待,螺旋槳 PaddleHelix 的發(fā)布能帶來(lái)更多的跨界驚喜,在生物醫(yī)藥、精準(zhǔn)醫(yī)療、疫苗設(shè)計(jì)等領(lǐng)域發(fā)揮出更大的價(jià)值。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    449

    瀏覽量

    38785
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2268

    瀏覽量

    90360
  • 生物
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    15752
  • 飛槳
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    2284
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    百度進(jìn)軍短劇領(lǐng)域,計(jì)劃全面升級(jí)平臺(tái)

    。這一舉動(dòng)無(wú)疑預(yù)示著百度正在積極布局短劇市場(chǎng),進(jìn)一步拓展其內(nèi)容生態(tài)。 對(duì)于此次進(jìn)軍短劇領(lǐng)域的舉措,百度相關(guān)負(fù)責(zé)人給出了積極的回應(yīng)。他表示,短劇作為當(dāng)前內(nèi)容生態(tài)的一個(gè)重要發(fā)展方向,已經(jīng)受
    的頭像 發(fā)表于 12-19 10:25 ?102次閱讀

    百度正式回應(yīng)進(jìn)軍短劇領(lǐng)域

    近日,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司在知識(shí)產(chǎn)權(quán)領(lǐng)域有了新的動(dòng)作,據(jù)天眼查信息顯示,該公司已申請(qǐng)注冊(cè)“百度短劇”商標(biāo),涵蓋網(wǎng)站服務(wù)、科學(xué)儀器、教育娛樂等多個(gè)國(guó)際分類,目前這些商標(biāo)均處于等待實(shí)質(zhì)審查
    的頭像 發(fā)表于 12-17 14:19 ?125次閱讀

    百度Apollo開放平臺(tái)10.0正式發(fā)布

    12月4日,百度正式發(fā)布Apollo開放平臺(tái)的全新升級(jí)版本——Apollo開放平臺(tái)10.0,基于自動(dòng)駕駛大模型ADFM設(shè)計(jì)重構(gòu)算法,助力全球開發(fā)者和企業(yè)以更低成本、更高性能、更安全的技
    的頭像 發(fā)表于 12-04 16:20 ?321次閱讀

    百度發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計(jì)劃在即將舉行的百度世界大會(huì)上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進(jìn)的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗(yàn)。
    的頭像 發(fā)表于 11-11 14:50 ?406次閱讀

    百度智能云發(fā)布千帆大模型平臺(tái)3.0

    2024年百度云智大會(huì)上,百度智能云震撼發(fā)布千帆大模型平臺(tái)3.0,標(biāo)志著其在AI領(lǐng)域又一里程碑式的進(jìn)步。新版
    的頭像 發(fā)表于 09-26 14:51 ?423次閱讀

    百度舸AI計(jì)算平臺(tái)4.0震撼發(fā)布

    在2024年百度云智大會(huì)的璀璨舞臺(tái)上,百度智能云重磅推出了舸AI異構(gòu)計(jì)算平臺(tái)的全新力作——4.0版本。此次升級(jí),標(biāo)志著
    的頭像 發(fā)表于 09-26 14:46 ?468次閱讀

    NVIDIA與百度攜手革新汽車風(fēng)阻預(yù)測(cè):DNNFluid-Car模型的崛起

    在追求更高效、更環(huán)保的汽車設(shè)計(jì)浪潮中,NVIDIA與百度攜手突破傳統(tǒng)界限,共同研發(fā)了一款革命性的3D高精度汽車風(fēng)阻預(yù)測(cè)模型——DNNFluid-Car。這款模型不僅標(biāo)志著AI技術(shù)在汽車空氣動(dòng)力學(xué)數(shù)值模擬領(lǐng)域的重大進(jìn)展,更以其
    的頭像 發(fā)表于 07-09 14:56 ?1590次閱讀

    百度發(fā)布文心大模型4.0 Turbo與飛框架3.0,引領(lǐng)AI技術(shù)新篇章

    SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)2024上,向世界展示了百度在AI領(lǐng)域的最新成果——文心大模型4.0 Turbo和飛框架3.0,并詳細(xì)披露了飛文心生態(tài)的最新發(fā)展動(dòng)態(tài)。
    的頭像 發(fā)表于 06-29 16:03 ?627次閱讀

    百度文心大模型4.0 Turbo,正式發(fā)布 用戶規(guī)模已達(dá)3億

    的最新數(shù)據(jù),并正式發(fā)布文心大模型4.0 Turbo、飛框架3.0等最新技術(shù),披露飛文心生態(tài)最新成果。 ?01?文心大模型4.0 Turbo發(fā)布? 文心一言用戶規(guī)模達(dá)3億 大會(huì)現(xiàn)場(chǎng),
    的頭像 發(fā)表于 06-29 10:06 ?853次閱讀

    電化學(xué)生物傳感器在生物檢測(cè)領(lǐng)域的顯著優(yōu)勢(shì)

    電化學(xué)生物傳感器在生物檢測(cè)領(lǐng)域具有顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)不僅體現(xiàn)在其高靈敏、快速響應(yīng)等方面,更在于其在醫(yī)學(xué)診斷、環(huán)境監(jiān)測(cè)、食品安全等多個(gè)領(lǐng)域
    的頭像 發(fā)表于 04-29 10:00 ?640次閱讀
    電化學(xué)<b class='flag-5'>生物</b>傳感器在<b class='flag-5'>生物</b>檢測(cè)<b class='flag-5'>領(lǐng)域</b>的顯著優(yōu)勢(shì)

    百度沈抖沈抖正式發(fā)布新一代智能計(jì)算操作系統(tǒng)—萬(wàn)源

    4月16日,Create 2024 百度AI開發(fā)者大會(huì)在深圳召開。期間,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布新一代智能計(jì)算
    的頭像 發(fā)表于 04-18 09:22 ?431次閱讀
    <b class='flag-5'>百度</b>沈抖沈抖正式<b class='flag-5'>發(fā)布</b>新一代智能<b class='flag-5'>計(jì)算</b>操作系統(tǒng)—萬(wàn)源

    百度沈抖:傳統(tǒng)云計(jì)算不再是主角,智能計(jì)算呼喚新一代“操作系統(tǒng)”

    4月16日,Create 2024 百度AI開發(fā)者大會(huì)在深圳召開。期間,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布新一代智能計(jì)算
    發(fā)表于 04-16 16:26 ?322次閱讀
    <b class='flag-5'>百度</b>沈抖:傳統(tǒng)云<b class='flag-5'>計(jì)算</b>不再是主角,智能<b class='flag-5'>計(jì)算</b>呼喚新一代“操作系統(tǒng)”

    百度智能云正式發(fā)布了《百度智能云水業(yè)大模型白皮書》

    3月28日,由E20環(huán)境平臺(tái)主辦的2024(第二十二屆)水業(yè)戰(zhàn)略論壇在北京召開。會(huì)上,百度智能云正式發(fā)布了《百度智能云水業(yè)大模型白皮書》(以下簡(jiǎn)稱《白皮書》)。
    的頭像 發(fā)表于 03-29 09:20 ?1361次閱讀
    <b class='flag-5'>百度</b>智能云正式<b class='flag-5'>發(fā)布</b>了《<b class='flag-5'>百度</b>智能云水業(yè)大模型白皮書》

    百度智能云宣布發(fā)布多款大模型

    百度智能云近日發(fā)布了一系列重要消息,其千帆平臺(tái)迎來(lái)了一系列升級(jí),為用戶帶來(lái)了更加豐富的功能和體驗(yàn)。其中,千帆AppBuilder AI原生應(yīng)用開發(fā)平臺(tái)全新升級(jí),其支持的組件工具數(shù)量擴(kuò)展
    的頭像 發(fā)表于 03-22 11:29 ?893次閱讀

    百度發(fā)布Apollo開放平臺(tái)9.0

    在2023年的12月19日,百度正式發(fā)布了Apollo開放平臺(tái)的全新版本——Apollo開放平臺(tái)9.0。這一版本的推出,源于團(tuán)隊(duì)在8.0至9.0的開發(fā)過(guò)程中,對(duì)12萬(wàn)行代碼進(jìn)行了重構(gòu),
    的頭像 發(fā)表于 01-02 16:18 ?1191次閱讀
    RM新时代网站-首页