RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“導(dǎo)游Bot”在模擬的紐約市中導(dǎo)航定位,使用自然語(yǔ)言跟“游客Bot”交流

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-13 09:57 ? 次閱讀

在FAIR和蒙特利爾大學(xué)合作的最新研究中,研究人員首次將實(shí)驗(yàn)中將感知、行動(dòng)和使用自然語(yǔ)言交互達(dá)成目標(biāo)這三個(gè)任務(wù)結(jié)合在一起:讓兩個(gè)Bot使用自然語(yǔ)言對(duì)話(huà),讓“導(dǎo)游bot”將“游客bot”帶到指定地點(diǎn),而且導(dǎo)航成功率超越了人類(lèi)。

Facebook讓兩個(gè)Bot自己游紐約,“導(dǎo)游Bot”在模擬的紐約市中導(dǎo)航定位,使用自然語(yǔ)言跟“游客Bot”交流,成功率超過(guò)了88%!

這已經(jīng)顯著超越某些“路癡”人類(lèi),而且,兩個(gè)Bot還是使用自然語(yǔ)言在交流。



兩個(gè)Bot使用自然語(yǔ)言交流導(dǎo)航定位

在今天最新上傳到arxiv的一篇研究論文中,F(xiàn)acebook人工智能實(shí)驗(yàn)室(FAIR)與蒙特利爾大學(xué)合作,研究人工智能系統(tǒng)如何定位,并比人類(lèi)更好地傳達(dá)觀測(cè)數(shù)據(jù)。

研究人員把他們的實(shí)驗(yàn)成為“Talk the Walk”。在實(shí)驗(yàn)中,他們將游客Bot隨機(jī)放到紐約市的一個(gè)街角,再讓一個(gè)導(dǎo)游Bot將前者引導(dǎo)到2D地圖上的某個(gè)位置。導(dǎo)游Bot知道地圖,也知道目標(biāo)地點(diǎn),但是不知道游客Bot在哪里;游客Bot擁有360°視角,但不知道地圖,也不清楚目標(biāo)地點(diǎn)。

游客和導(dǎo)游必須相互溝通,交流彼此所知道的信息,才能實(shí)現(xiàn)目標(biāo)。

想象一下兩個(gè)Bot的對(duì)話(huà):

導(dǎo)游:你好,你在附近嗎?

游客:你好,在我面前是“布魯克斯兄弟”。

導(dǎo)游:這是家商店還是餐館?

游客:這是一家服裝店。

導(dǎo)游:你往地圖西北角的十字路口走。

游客:我身后似乎有一家銀行。

導(dǎo)游:好的,左轉(zhuǎn)然后沿著那條路直行。

...

研究人員表示,Talk the Walk是首個(gè)將所有三個(gè)要素結(jié)合在一起的任務(wù):感知(游客Bot觀察世)、行為(游客Bot在環(huán)境中導(dǎo)航),以及語(yǔ)言交互達(dá)成目標(biāo)(導(dǎo)游Bot為游客Bot提供引導(dǎo)幫助其實(shí)現(xiàn)目標(biāo))。

首次將感知、行動(dòng)和使用自然語(yǔ)言交流達(dá)成目標(biāo)結(jié)合在一起

實(shí)驗(yàn)中使用的街景地圖數(shù)據(jù),是MTurk眾包手動(dòng)收集的幾個(gè)紐約市街區(qū)的360°視圖。這些街景環(huán)境被整合到ParlAI中,這是Facebook的一個(gè)用于訓(xùn)練AI的框架,支持很多任務(wù),包含的數(shù)據(jù)集包括SQuAD,bAbI tasks,MS MARCO,MCTest,WikiQA,WebQuestions等等。

實(shí)驗(yàn)中使用的自然語(yǔ)言數(shù)據(jù),也是MTurk的真人對(duì)話(huà),用幾周時(shí)間收集,包含10k成功的導(dǎo)航對(duì)話(huà)。平均來(lái)說(shuō),人類(lèi)需要超過(guò)62次行動(dòng)(對(duì)話(huà)和走路)才能順利到達(dá)目標(biāo)地點(diǎn)。大部分行動(dòng)發(fā)生在游客這邊,平均每次對(duì)話(huà)44次行動(dòng)。人類(lèi)導(dǎo)游大約說(shuō)了9次話(huà)(稍微比游客的8次話(huà)多一點(diǎn)點(diǎn))。

雖然研究人員的目標(biāo)是讓Bot通過(guò)自然語(yǔ)言來(lái)處理收集到的信息,但他們發(fā)現(xiàn),當(dāng)Bot使用“合成語(yǔ)言”時(shí),完成任務(wù)的效果更好,因?yàn)楹笳吒蕾?lài)于使用更簡(jiǎn)單的符號(hào)來(lái)傳達(dá)信息和位置。這種不那么自然的數(shù)據(jù)通信方式不僅優(yōu)于人類(lèi)的聊天,還能讓Bot比人在自然語(yǔ)言聊天中更簡(jiǎn)單快讀地找到自己的道路。

機(jī)器比人類(lèi)更擅長(zhǎng)導(dǎo)航定位!

Talk The Walk的實(shí)驗(yàn)環(huán)境設(shè)置全部來(lái)自現(xiàn)實(shí)世界,因此尤其困難。讓兩個(gè)人用文字描述自己周?chē)牟皇煜きh(huán)境已經(jīng)不容易,何況兩個(gè)Bot?

為了解決這個(gè)問(wèn)題,研究人員提出了一個(gè)名為MASC(Masked Attention for Spatial Convolution)的機(jī)制,讓Bot能快速?gòu)恼Z(yǔ)言模型中解析對(duì)方回應(yīng)的關(guān)鍵字的內(nèi)容。Facebook表示,利用該流程可以使正在測(cè)試的結(jié)果的準(zhǔn)確性翻倍。

結(jié)果顯示,他們最好的溝通模型(emergent communication model)準(zhǔn)確率幾乎達(dá)到了70%,要顯著優(yōu)于從人類(lèi)話(huà)語(yǔ)中得到最好的定位模型(大約20%),這表明人類(lèi)很不善于定位,因?yàn)槿祟?lèi)并不總能很好地傳達(dá)自己的觀察和行動(dòng)。

不僅如此,他們最好的定位模型(continuous communication, with MASC, and T = 3)在整個(gè)導(dǎo)航任務(wù)測(cè)試中達(dá)到了88.33%的準(zhǔn)確率,超過(guò)了人類(lèi)76.74%的表現(xiàn)。

激動(dòng)人心的新研究方向:用自然語(yǔ)言對(duì)話(huà)解決現(xiàn)實(shí)世界問(wèn)題

研究人員表示,這是一項(xiàng)基礎(chǔ)性研究,這次實(shí)驗(yàn)只是初步結(jié)果,還提出了更多的問(wèn)題等待解決。

“如果你真的想要解決所有人工智能問(wèn)題,那么你可能要有解決不同子問(wèn)題的不同模塊或組件,”Facebook AI研究科學(xué)家Douwe Kiela在接受TechCrunch記者采訪時(shí)表示:“從這個(gè)意義上說(shuō),這個(gè)問(wèn)題是一個(gè)真正的挑戰(zhàn)。”

他希望有更多的人參與進(jìn)來(lái)與他們共同在這個(gè)激動(dòng)人心的新研究方向上與他們合作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54719
  • 導(dǎo)航定位
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    11021
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    287

    瀏覽量

    13346

原文標(biāo)題:兩個(gè)Bot自創(chuàng)新語(yǔ)言!Facebook機(jī)器人紐約自由行導(dǎo)航定位碾壓人類(lèi)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    意欲挑戰(zhàn)硅谷,紐約市***斥巨資打造VR/AR實(shí)驗(yàn)室

    。近日,紐約市***宣布,將斥資600萬(wàn)美元興建全美首間由***投資的“VR/AR實(shí)驗(yàn)室”,預(yù)期明年初投標(biāo),最快明年底落成。這是美國(guó)東海岸第一次投資VR/AR,紐約市經(jīng)濟(jì)發(fā)展局局長(zhǎng)Maria
    發(fā)表于 12-16 15:48

    python自然語(yǔ)言

    最近,python自然語(yǔ)言是越來(lái)越火了,那么什么是自然語(yǔ)言。自然語(yǔ)言(Natural Language )廣納了眾多技術(shù),對(duì)自然或人類(lèi)語(yǔ)言進(jìn)
    發(fā)表于 05-02 13:50

    【推薦體驗(yàn)】騰訊云自然語(yǔ)言處理

    `相信大家對(duì)NLP自然語(yǔ)言處理的技術(shù)都不陌生,它是計(jì)算機(jī)科學(xué)領(lǐng)域和AI領(lǐng)域中的一個(gè)分支,它與計(jì)算機(jī)和人類(lèi)之間使用自然語(yǔ)言進(jìn)行交互密切相關(guān),而NLP的最終目標(biāo)是使計(jì)算機(jī)能夠像人類(lèi)一樣理解語(yǔ)言。目前
    發(fā)表于 10-09 15:28

    可替代人工導(dǎo)游的智能導(dǎo)游講解器

    GPS+BDS+LBS多重定位,內(nèi)置高靈敏度陶瓷天線(xiàn),快速定位,2.8寸TFT高清彩屏240*320分辨率,顯示景區(qū)導(dǎo)覽圖游客實(shí)時(shí)了解景區(qū)所處哪里,RFID無(wú)線(xiàn)技術(shù)自動(dòng)化
    發(fā)表于 11-12 17:24

    智能無(wú)線(xiàn)導(dǎo)游講解器 游客多重安全守護(hù)

    `無(wú)線(xiàn)導(dǎo)游講解器特點(diǎn):GPS+BDS+LBS 多重定位,內(nèi)置高靈敏度陶瓷天線(xiàn),快速定位2.8寸TFT高清彩屏240*320分辨率,顯示景區(qū)導(dǎo)覽圖游客實(shí)時(shí)了解
    發(fā)表于 11-19 18:20

    智能導(dǎo)游講解器導(dǎo)游機(jī)您的私人導(dǎo)游助理

    TFT高清彩屏240*320分辨率,顯示景區(qū)導(dǎo)覽圖游客實(shí)時(shí)了解景區(qū)所處位置,RFID無(wú)線(xiàn)技術(shù)自動(dòng)化語(yǔ)言播報(bào)和定位,無(wú)需人工講解,雙向語(yǔ)音通話(huà),即時(shí)溝通。 緊急情況下S0S鍵直接呼叫
    發(fā)表于 11-21 17:51

    智能電子導(dǎo)游機(jī)自助講解 4G全網(wǎng)通導(dǎo)游機(jī)

    彩屏800*480分辨率,顯示景區(qū)導(dǎo)覽圖游客實(shí)時(shí)了解景區(qū)所處位置,RFID無(wú)線(xiàn)技術(shù)自動(dòng)化語(yǔ)言播報(bào)和定位,無(wú)需人工講解,雙向語(yǔ)音通話(huà),即時(shí)溝通。 產(chǎn)品特點(diǎn):北斗
    發(fā)表于 12-02 18:03

    景區(qū)無(wú)線(xiàn)導(dǎo)游講解設(shè)備導(dǎo)游機(jī)定制

    `導(dǎo)游機(jī)內(nèi)含GPS+BDS+LBS多重定位,內(nèi)置高靈敏度陶瓷天線(xiàn),2.8寸TFT高清彩屏240*320分辨率,顯示景區(qū)導(dǎo)覽圖游客實(shí)時(shí)了解景區(qū)所處位置,RFID無(wú)線(xiàn)技術(shù)自動(dòng)化
    發(fā)表于 12-31 17:54

    自然語(yǔ)言處理的語(yǔ)言模型

    自然語(yǔ)言處理——53 語(yǔ)言模型(數(shù)據(jù)平滑)
    發(fā)表于 04-16 11:11

    什么是自然語(yǔ)言處理

    什么是自然語(yǔ)言處理?自然語(yǔ)言處理任務(wù)有哪些?自然語(yǔ)言處理的方法是什么?
    發(fā)表于 09-08 06:51

    自然語(yǔ)言處理怎么最快入門(mén)_自然語(yǔ)言處理知識(shí)了解

    自然語(yǔ)言處理就是實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信,實(shí)現(xiàn)自然語(yǔ)言理解和自然語(yǔ)言生成是十分困難的,造成困難的根本原因是自然語(yǔ)言文本和對(duì)話(huà)的各個(gè)層次上廣泛存
    發(fā)表于 12-28 17:10 ?5308次閱讀

    視覺(jué)語(yǔ)言導(dǎo)航領(lǐng)域任務(wù)、方法和未來(lái)方向的綜述

    視覺(jué)語(yǔ)言導(dǎo)航(VLN)是一個(gè)新興的研究領(lǐng)域,旨在構(gòu)建一種可以用自然語(yǔ)言與人類(lèi)交流并在真實(shí)的3D環(huán)境中導(dǎo)航的具身代理,與計(jì)算機(jī)視覺(jué)、
    的頭像 發(fā)表于 09-20 14:30 ?4175次閱讀

    自然語(yǔ)言處理的概念和應(yīng)用 自然語(yǔ)言處理屬于人工智能嗎

      自然語(yǔ)言處理(Natural Language Processing)是一種人工智能技術(shù),它是研究自然語(yǔ)言與計(jì)算機(jī)之間的交互和通信的一門(mén)學(xué)科。自然語(yǔ)言處理旨在研究機(jī)器如何理解人類(lèi)語(yǔ)言
    發(fā)表于 08-23 17:31 ?1550次閱讀

    神經(jīng)網(wǎng)絡(luò)自然語(yǔ)言處理中的應(yīng)用

    自然語(yǔ)言處理(NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它研究的是如何使計(jì)算機(jī)能夠理解和生成人類(lèi)自然語(yǔ)言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)自然語(yǔ)言處理中的應(yīng)用逐漸展現(xiàn)出其強(qiáng)大的潛力
    的頭像 發(fā)表于 07-01 14:09 ?484次閱讀

    自然語(yǔ)言處理包括哪些內(nèi)容

    ,從而實(shí)現(xiàn)人機(jī)之間的自然交流。本文將詳細(xì)介紹NLP的主要內(nèi)容,包括基本概念、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域等。 一、自然語(yǔ)言處理的基本概念 自然語(yǔ)言自然語(yǔ)言
    的頭像 發(fā)表于 07-03 14:15 ?815次閱讀
    RM新时代网站-首页