RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新誕生的機(jī)器學(xué)習(xí)框架可以讓你更加直觀、輕松地拼完整個(gè)模型

電子工程師 ? 來源:OSC開源社區(qū) ? 作者:OSC開源社區(qū) ? 2022-08-08 16:17 ? 次閱讀

喜歡樂高、熟悉樂高的朋友們應(yīng)該都是清楚,如今有些樂高產(chǎn)品完全是面向大人的,它們的復(fù)雜程度遠(yuǎn)高于面向兒童的產(chǎn)品。以樂高千年隼號(hào)(Millennium Falcon)和帝國殲星艦(Imperial Star Destroyer)這兩款產(chǎn)品為例,它們的積木顆粒分別為 7541 個(gè)和 4784 個(gè),不少人花費(fèi)了數(shù)月時(shí)間才最終拼完。據(jù)說拼過這兩款積木的用戶最后都 “病” 了,癥狀表現(xiàn)為看到積木就頭疼、手不由自主發(fā)抖、容易犯嘔。

不想被一個(gè)玩具難倒了?那么這個(gè)新誕生的機(jī)器學(xué)習(xí)框架可以讓你更加直觀、輕松地拼完整個(gè)模型。

a7af5a88-16c5-11ed-ba43-dac502259ad0.gif

Autodesk、斯坦福大學(xué)和麻省理工學(xué)院的研究人員探討了將人類設(shè)計(jì)師創(chuàng)造的基于圖像的、分步驟的裝配手冊翻譯成機(jī)器可理解的指令的問題。研究人員將這個(gè)問題表述為一個(gè)連續(xù)的預(yù)測任務(wù):在每個(gè)步驟中,該模型都會(huì)讀取手冊,定位要添加到當(dāng)前形狀中的部件,并推斷出它們在三維空間的位置。這項(xiàng)任務(wù)帶來的挑戰(zhàn)是在手冊圖像和真實(shí)的三維物體之間建立「二維到三維」的對(duì)應(yīng)關(guān)系,以及對(duì)未見過的三維物體進(jìn)行三維姿態(tài)預(yù)測,因?yàn)樵谝粋€(gè)步驟中要添加的新部件可能是全新的小積木,也可能是由以前的步驟拼成的物體(例如一個(gè)人物模型,說明書通常是讓用戶先拼完人物的四肢和頭部,然后再將四肢和頭部與人物主體互相拼接在一起形成整體;而不是像 3D 打印,一步步從頭到腳慢慢成型)。

為了解決這兩個(gè)挑戰(zhàn),研究人員提出了一個(gè)新的基于學(xué)習(xí)的框架,即 MEPNet(Manual-to-Executable-Plan Network),它從一連串的手冊圖像中重構(gòu)拼裝步驟。其關(guān)鍵思想是整合神經(jīng)的二維關(guān)鍵點(diǎn)檢測模塊和「二維到三維」投影算法,以實(shí)現(xiàn)高精度的預(yù)測和對(duì)未見過的組件的強(qiáng)概括性。通過測試發(fā)現(xiàn),MEPNet 的表現(xiàn)優(yōu)于現(xiàn)有方法。

研究人員表示,現(xiàn)有的將說明書步驟解析為機(jī)器可理解的指令的方法主要包括兩種形式,一個(gè)是基于搜索的方法,該方法簡單而準(zhǔn)確,但計(jì)算成本高;另一個(gè)是基于學(xué)習(xí)的模型,速度快,但不善于處理未見過的 3D 形狀,而 MEPNet 結(jié)合了上述兩種方法。

除了可以用來拼樂高,在論文中研究人員還表示,他們的目標(biāo)是創(chuàng)造幫助人們組裝復(fù)雜物體的機(jī)器,他們的應(yīng)用范圍除了樂高的積木,還包括宜家的家具。因此利用這個(gè)框架,開發(fā)者有望開發(fā)出比普通家具說明更容易讓用戶理解的安裝手冊。

想測試 MEPNet 并且熟悉 Pytorch 的用戶可以在 Github 上找到項(xiàng)目的代碼 :https://github.com/Relento/lego_release

我十分懷疑,開發(fā)這個(gè)框架的研究員假借研究的名義偷偷玩樂高。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8406

    瀏覽量

    132561
  • 開源框架
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    9412
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    807

    瀏覽量

    13198

原文標(biāo)題:樂高、宜家說明書太難懂?Autodesk開源框架幫你解決

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    大語言模型開發(fā)框架是什么

    大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型開發(fā)框架。
    的頭像 發(fā)表于 12-06 10:28 ?115次閱讀

    Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架

    Arm 與騰訊攜手合作,成功將 Arm KleidiAI 軟件庫集成到騰訊自研的 Angel 機(jī)器學(xué)習(xí)框架。 ? 借助 KleidiAI 解鎖卓越性能、能效和可移植性,騰訊混元大模型
    的頭像 發(fā)表于 11-24 15:33 ?661次閱讀

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)的區(qū)別

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)在多個(gè)方面存在顯著的區(qū)別。以下是對(duì)這些區(qū)別的介紹: 一、模型規(guī)模與復(fù)雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?550次閱讀

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫?

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 第一、二章學(xué)習(xí)感受

    程分為下圖中的四步: 此后引入機(jī)器學(xué)習(xí)開發(fā)框架TensorFlow,該框架下集成了多種“輪子”,但要避免“重復(fù)造輪子”。下一小節(jié)是分布式AI訓(xùn)練,從中知道了訓(xùn)練測略分為
    發(fā)表于 10-10 10:36

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器
    發(fā)表于 08-12 11:21

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 俯瞰全書

    上周收到《大語言模型應(yīng)用指南》一書,非常高興,但工作項(xiàng)目繁忙,今天才品鑒體驗(yàn),感謝作者編寫了一部內(nèi)容豐富、理論應(yīng)用相結(jié)合、印刷精美的著作,也感謝電子發(fā)燒友論壇提供了一個(gè)我了解大語言模型機(jī)器
    發(fā)表于 07-21 13:35

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測試集,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?3799次閱讀

    Al大模型機(jī)器

    豐富的知識(shí)儲(chǔ)備。它們可以涵蓋各種領(lǐng)域的知識(shí),并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些
    發(fā)表于 07-05 08:52

    谷歌推出AI框架,實(shí)現(xiàn)AI模型的自然語言學(xué)習(xí)

    據(jù)了解,在此款“社交學(xué)習(xí)框架中,“學(xué)生模型”可向多位已處理指定任務(wù)的“教師模型”請教各類應(yīng)對(duì)方案,研究團(tuán)隊(duì)主要通過開展“垃圾短信檢測”、“解決小學(xué)數(shù)學(xué)題”及“根據(jù)文本回答問題”等多項(xiàng)
    的頭像 發(fā)表于 03-11 11:36 ?924次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個(gè)開源的
    的頭像 發(fā)表于 03-01 16:25 ?870次閱讀

    谷歌模型框架是什么?有哪些功能和應(yīng)用?

    谷歌模型框架(Google Model Framework)并不是一個(gè)特定的框架,而是指谷歌開發(fā)的一系列軟件框架,用于支持機(jī)器
    的頭像 發(fā)表于 02-29 18:11 ?1470次閱讀

    基于NumPy的機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)

    David Bourgin 表示他一直在慢慢寫或收集不同模型與模塊的純 NumPy 實(shí)現(xiàn),它們跑起來可能沒那么快,但是模型的具體過程一定足夠直觀。每當(dāng)我們想了解模型 API 背后的實(shí)現(xiàn)
    發(fā)表于 01-17 12:36 ?198次閱讀
    基于NumPy的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>算法實(shí)現(xiàn)

    如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創(chuàng)建一個(gè)簡單的機(jī)器學(xué)習(xí)模型
    的頭像 發(fā)表于 01-08 09:25 ?967次閱讀
    如何使用TensorFlow構(gòu)建<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>
    RM新时代网站-首页