RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Parabricks v4.1的功能

jf_pJlTbmA9 ? 來源:NVIDIA ? 作者:NVIDIA ? 2023-07-05 16:30 ? 次閱讀

NVIDIA Parabricks 是一套加速的基因組分析應用程序,它在加速測序比對和提高深度學習變體調(diào)用的準確性方面比以往任何時候都更進一步。該版本包括 PacBio 長讀數(shù)據(jù)的新工作流程,包括加速的 Minimap2 工具和谷歌的 DeepVariant ,用于對 PacBio 數(shù)據(jù)進行完整的 GPU 端到端分析。

NVIDIA Parabricks 可以免費使用,并提供付費企業(yè)支持選項。它包含各種優(yōu)化的、基于人工智能的行業(yè)標準基因組工具,比基于 CPU 的工具提供高達 80 倍的加速,并將計算成本降低高達 50% 。與 CPU 上的約 24 小時相比,現(xiàn)在只需 16 分鐘即可分析 30 倍的全基因組,相當于每年在一臺服務器上分析多達 30000 個全基因組。

快速查看 Parabricks v4.1 的功能

一種新的 DeepVariant 重新訓練工具,使任何人都能為自己的數(shù)據(jù)重新訓練或微調(diào) DeepVariation ,從而實現(xiàn)更準確的變體調(diào)用(現(xiàn)已在 NGC 上提供)。

PacBio 的端到端( FastQ 到 VCF )加速工作流,將在 GitHub 、 Terra.Bio 和其他云平臺上的 Parabricks 工作流中提供。

新的加速 Minimap2 工具,用于調(diào)整 PacBio 的長讀數(shù)。

用于 PacBio 數(shù)據(jù)的新加速 DeepVariant 變體調(diào)用程序,在 DGX 站[4xA100 GPU s]上運行 30 倍全基因組,運行時間為 8 分鐘。

與 v4.0 中的 21 分鐘和僅在 CPU – 上的約 24 小時相比, DGX A100 GPU [8xA100 GPU s]在 16 分鐘內(nèi)進一步加速了 30 倍全基因組的短讀種系管道。

與新的 NVIDIA H100 GPU 兼容,其中包括強大的 DPX 指令,用于增強動態(tài)編程算法,如 Smith Waterman ,用于局部序列比對。

注冊以獲得 Parabricks 4.1 release 的通知,或嘗試 prerelease DeepVariant re-training tool 。

支持長讀分析

長讀測序,即對明顯較長的 DNA 片段進行測序的能力,與傳統(tǒng)的短讀測序相比具有多種固有優(yōu)勢。最重要的是,這些讀數(shù)更容易被組裝到完整的基因組中。

較低水平的模糊性和比對誤差使長讀測序更好地用于基因組中更具挑戰(zhàn)性的部分(例如,高度重復的區(qū)域)或組裝基因組 de novo (沒有提供參考文獻)。

這為測序界帶來了許多改進,包括對結構變異(大插入、缺失、反轉(zhuǎn)、重復等)有了更多的了解。結構變異可能導致疾病,如盧·格里格?。?ALS )、帕金森病和心臟病。

它還最終使科學界能夠端到端地完全完成人類參考基因組,即 2022 年發(fā)布的端粒到端粒( T2T )基因組。

long-read-tooling-workflow-parabricks.jpg 圖 2:Parabricks 4.1 中提供了長閱讀工具和工作流程,并為 PacBio 提供了新的 Minimap2 和 FastQ 到 VCF

PacBio 是長閱讀測序領域的杰出領導者。他們的技術產(chǎn)生長達 25 千堿基的讀?。ㄏ啾戎?,每次讀取的短讀取測序< 300 堿基)。他們還通過基于循環(huán)一致性測序的 HiFi 讀取技術和基于 transformer 的深度學習模型 DeepConsensus 的分析,突破了測序準確性的界限。

PacBio 的 Revio 長讀測序系統(tǒng)采用 NVIDIA GPU ,每年可將這種方法擴展到 1300 個人類全基因組。

除此之外, NVIDIA Parabricks 4.1軟件可用于 GPU -與Minimap2的加速對齊,以及與DeepVariant的PacBio模型的變體調(diào)用,為PacBio數(shù)據(jù)提供完整的端到端工作流程。

DeepVariant 使用 Parabricks 重新訓練

DeepVariant 是一個基于 CNN 的準確變體調(diào)用程序,用于短讀和長讀數(shù)據(jù)的種系工作流,作為 NVIDIA Parabricks 的一部分,在 GPU 上加速。 Parabricks 4.1 包括一個框架,用于重新訓練和微調(diào)基礎 CNN 模型,為分析工作流程帶來更準確的變體調(diào)用。

具體來說,這具有能夠?qū)⒛P臀⒄{(diào)到單個數(shù)據(jù)集并識別后續(xù)數(shù)據(jù)中產(chǎn)生的任何非隨機偽影的優(yōu)點。這已經(jīng)成功地應用于測序儀級別,例如 Ultima 、 Singular 和 PacBio 都生產(chǎn)了自己的特定模型,并根據(jù)其獨特的誤差分布進行了訓練。

它也已應用于項目級別,例如 Regeneron Genetic Center’s exome sequencing as part of the UKBioBank project 。不同的實驗室通常使用不同版本的測序儀、濕實驗室試劑盒和試劑,并且通常有不同的實驗室流程。所有這些差異都可能在它們的樣本中引入微妙而獨特的人工制品。

通過使用 DeepVariant 基礎模型作為一個溫暖的開端,通過對少數(shù)瓶中基因組細胞系進行測序以進行訓練、測試和驗證,實施實驗室特定的微調(diào)可以是一個相對簡單的過程。

在 Regeneron 的情況下,使用單個 V100 GPU 訓練 12 小時,僅在一個樣本( HG001 )上訓練就足以看到模型收斂, 20% 的數(shù)據(jù)保留用于測試,第二個樣本( HG002 )用于驗證。這使得相對少量的數(shù)據(jù)在準確性上有了令人印象深刻的提高,例如將 INDEL 的孟德爾誤差率從 0.075 降低到 0.056 。

DeepVariant-re-training-framework-flow.jpg 圖 4 。 DeepVariant 重新訓練框架流程圖,包括使用 hap.py 進行準確性測試

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102987
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268886
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121111
收藏 人收藏

    評論

    相關推薦

    請問ESP-IDF v4.1怎么生成靜態(tài)庫和調(diào)用靜態(tài)庫?

    ESP-IDF v4.1怎么生成靜態(tài)庫和調(diào)用靜態(tài)庫
    發(fā)表于 06-24 09:00

    dy3208電子鐘_v4.1

    dy3208電子鐘_v4.1
    發(fā)表于 04-12 12:31

    RVDS v4.1 官方開發(fā)工具

    this compiler build and previous v4.1 builds, see the latest release note for ARM Compiler v4.1 located
    發(fā)表于 10-15 10:30

    《Camera_for_RockChipSDK參考說明_v4.1》下載

    關于攝像頭調(diào)試的文檔《Camera_for_RockChipSDK參考說明_v4.1》 下載地址:http://developer.t-firefly.com/thread-12429-1-1.html
    發(fā)表于 09-19 16:51

    uniflash V4.1 無法為CC3220SF下載代碼

    uniflash V4.1 無法通過串口為CC3220SF下載代碼,顯示的錯誤如下,有人知道是為什么嗎?
    發(fā)表于 05-14 02:12

    電機控制工作臺4.1如何通過ST MC Workbench v4.1計算系數(shù)

    嗨, 我正在使用狀態(tài)觀察器+ PLL算法和觀察者+ CORDIC,我試圖找出GAIN1,GAIN2,縮放因子和PLL KP / KI如何通過ST MC Workbench v4.1計算系數(shù)
    發(fā)表于 10-10 17:54

    有人有ESP-WROVER-KIT V4.1的BOM嗎?求分享

    有人有ESP-WROVER-KIT V4.1的BOM嗎?我正在嘗試找出該套件上使用的外部 RTC 晶體(品牌、類型、負載電容器等),因此,我可以在我設計的 ESP32-WROOM-32 板上測試相同類型的晶體,并面臨穩(wěn)定性RTC 振蕩器啟動和一般操作的行為
    發(fā)表于 04-12 06:24

    Altera發(fā)布無線基站和遠程射頻前端設計CPRI v4.1

    Altera發(fā)布無線基站和遠程射頻前端設計CPRI v4.1 IP內(nèi)核 Altera公司宣布,開始提供通用公共射頻接口(CPRI) v4.1知識產(chǎn)權(IP)內(nèi)核。CPRI v4.1 IP內(nèi)核可實現(xiàn)高達6.144 Gbps的通道
    發(fā)表于 08-11 09:13 ?561次閱讀

    中學電路虛擬實驗室 V4.1下載

    中學電路虛擬實驗室 V4.1下載
    發(fā)表于 02-26 17:28 ?5次下載

    NetAssist網(wǎng)絡調(diào)試助手V4.1應用程序免費下載

    本文檔的主要內(nèi)容詳細介紹的是NetAssist網(wǎng)絡調(diào)試助手V4.1應用程序免費下載。
    發(fā)表于 03-16 08:00 ?11次下載
    NetAssist網(wǎng)絡調(diào)試助手<b class='flag-5'>V4.1</b>應用程序免費下載

    關于Wi-Fi CERTIFIED EasyMesh測試計劃v4.1版本

    近日,Wi-Fi聯(lián)盟更新了Wi-Fi CERTIFIED EasyMesh測試計劃v4.1版本,以闡明與測試用例適用性的相關條件,此版本將Wi-Fi Agile Multiband (MBO) 添加為認證前提條件。
    的頭像 發(fā)表于 06-24 11:31 ?2922次閱讀

    SSC 通信板 V4.1 數(shù)據(jù)表

    SSC 通信板 V4.1 數(shù)據(jù)表
    發(fā)表于 03-15 19:30 ?0次下載
    SSC 通信板 <b class='flag-5'>V4.1</b> 數(shù)據(jù)表

    SSC 通信板 V4.1 數(shù)據(jù)表

    SSC 通信板 V4.1 數(shù)據(jù)表
    發(fā)表于 07-06 18:41 ?0次下載
    SSC 通信板 <b class='flag-5'>V4.1</b> 數(shù)據(jù)表

    DMA/Bridge Subsystem for PCI Express v4.1指南

    電子發(fā)燒友網(wǎng)站提供《DMA/Bridge Subsystem for PCI Express v4.1指南.pdf》資料免費下載
    發(fā)表于 09-14 10:33 ?2次下載
    DMA/Bridge Subsystem for PCI Express <b class='flag-5'>v4.1</b>指南

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發(fā)布,其加入了新的體細胞數(shù)據(jù)變異檢測功能,并將業(yè)內(nèi)領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發(fā)布 Parabricks v4.3
    的頭像 發(fā)表于 09-10 10:22 ?374次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Parabricks</b> <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>
    RM新时代网站-首页