RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Assistant的新功能——Duplex雙工技術(shù)

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:00 ? 次閱讀

在6月的1400多篇機器學習相關(guān)的文章/項目中,Mybridge甄選了10篇最熱文章(入選率0.7%)。主題包括:Google Duplex,網(wǎng)格單元,神經(jīng)網(wǎng)絡(luò),TensorFlow,Keras,第一名解決方案,CVPR 2018等。

在 5 月的1400多篇機器學習相關(guān)的文章/項目中,Mybridge甄選了10篇最熱文章(入選率0.7%)。

此列表中的主題:Google Duplex,網(wǎng)格單元,神經(jīng)網(wǎng)絡(luò),TensorFlow,Keras,第一名解決方案,CVPR 2018等。

Top 10文章由Mybridge AI選出,綜合考慮文章分享數(shù)量、閱讀時間等,并使用機器學習算法對文章進行排序。相信這些文章分享的機器學習經(jīng)驗和技巧是有用的。

1. Google Duplex:一個通過電話完成真實世界任務(wù)的AI系統(tǒng)

5月份最受關(guān)注的是谷歌在I/O大會演示的Google Assistant的新功能——Duplex雙工技術(shù)。

利用Duplex雙工技術(shù),谷歌的智能助理能用非常類似人聲的角色完成真實世界的任務(wù)。在demo中,谷歌CEO Pichai告訴聽眾,“你將要聽到的是,谷歌的助理實際地打電話給一家真實的美容院,為你安排一個預約?!碑斎唬悄苤韼缀鹾翢o破綻地完成了任務(wù)。雖然后來這個演示是否真實受到一些質(zhì)疑,但這一技術(shù)引發(fā)了業(yè)界熱議。

在這篇文章中,谷歌首席工程師Yaniv Leviathan和工程副總裁Yossi Matias詳細介紹了Google Duplex使用到的技術(shù),包括:

Duplex的核心是一個循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),使用TensorFlow Extended(TFX)構(gòu)建。

使用谷歌自己的自動語音識別(ASR)技術(shù)來處理語音,將語音轉(zhuǎn)換為文本。

使用連續(xù)文本到語音(TTS)引擎和綜合TTS引擎(使用Tacotron和WaveNet)的組合,根據(jù)情況控制語調(diào)。

https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

2. “換臉術(shù)”Deep Video Portraits

Deep Video Portraits是斯坦福大學、慕尼黑技術(shù)大學等的研究人員提交給今年8月SIGGRAPH大會的一篇論文,描述了一種經(jīng)過改進的“換臉”技術(shù),可以在視頻中用一個人的臉再現(xiàn)另一人臉部的動作、面部表情和說話口型。

例如,將普通人的臉換成奧巴馬的臉。Deep Video Portraits可以通過一段目標人物的視頻(在這里就是奧巴馬),來學習構(gòu)成臉部、眉毛、嘴角和背景等的要素以及它們的運動形式。

論文地址:https://arxiv.org/abs/1805.11714

3.在人工智能體中使用網(wǎng)格表示進行導航

雖然AI在圍棋等許多任務(wù)超過了人類,空間導航能力對于人工智能體來說仍然是一個巨大的挑戰(zhàn)。DeepMind在Nature上發(fā)表的一篇論文引起AI領(lǐng)域和神經(jīng)科學領(lǐng)域的極大震撼:AI展現(xiàn)出與人腦“網(wǎng)格細胞”高度一致的空間導航能力。

通過一系列實驗操作,研究人員發(fā)現(xiàn)網(wǎng)格單元對于基于矢量的導航至關(guān)重要。例如,當網(wǎng)絡(luò)中的網(wǎng)格單元被掐斷時,agent的導航能力就會受損,而且對目標的距離和方向的判斷等關(guān)鍵指標的表示變得不那么準確。這項發(fā)現(xiàn)有助于AI可解釋性的研究。

地址:https://deepmind.com/blog/grid-cells

4.如何用Python從頭開始構(gòu)建一個神經(jīng)網(wǎng)絡(luò)

這是一個入門教程,初學者可以從這個教程開始,了解深度學習的內(nèi)部運作。

神經(jīng)網(wǎng)絡(luò)是什么呢?許多介紹性文章會將其與大腦進行類比,但如果拋開神經(jīng)網(wǎng)絡(luò)和人腦的類比,將其描述為一個給定的輸入和一個期望的輸出之間的映射的數(shù)學函數(shù),會更好理解。

神經(jīng)網(wǎng)絡(luò)包含以下元素:

一個輸入層x

任意數(shù)量的隱藏層

一個輸出層?

每一層之間的一組權(quán)重W和偏差b

每個隱藏層的激活函數(shù)σ。在這個教程中,使用Sigmoid激活函數(shù)。

圖:一個2層神經(jīng)網(wǎng)絡(luò)的架構(gòu)

地址:https://towardsdatascience.com/how-to-build-your-own-neural-network-from-scratch-in-python-68998a08e4f6

5.對Airbnb上的照片進行分類

Airbnb為數(shù)百萬的民宿提供了一個平臺,也因此獲得了一大批民宿的房間細節(jié)照片和用戶數(shù)據(jù)。在這個任務(wù)中,Airbnb的數(shù)據(jù)團隊利用計算機視覺深度學習對民宿房屋照片進行分類。

其目的一方面是將具有相似風格的房源聚集到一起,方便用戶瀏覽。另一方面,分類也可以幫助驗證房間數(shù)量和房屋信息的準確性。該團隊表示,利用這些圖片數(shù)據(jù),還將發(fā)掘出更多潛在的信息。

地址:https://medium.com/airbnb-engineering/categorizing-listing-photos-at-airbnb-f9483f3ab7e3

6. Loc2Vec:用triplet-loss網(wǎng)絡(luò)學習位置嵌入

這是一個以智能手機傳感器數(shù)據(jù)作為輸入,例如加速度計、陀螺儀和位置信息,并從中提取行為洞察的平臺,用于了解用戶的模式,并能夠預測和解釋事情發(fā)生的原因。

這個平臺的一個重要組成部分是場地映射算法(venue mapping algorithm)。venue mapper的目標是弄清楚你要訪問的地點。

地址:http://www.sentiance.com/2018/05/03/loc2vec-learning-location-embeddings-w-triplet-loss-networks/

7.在瀏覽器中使用TensorFlow.js進行實時人體姿態(tài)估計

這是來自TensorFlow博客的教程,與谷歌創(chuàng)意實驗室合作,發(fā)布了TensorFlow.js版本的PoseNet。PoseNet是一個機器學習模型,可以在瀏覽器中實時估計人體姿態(tài)。

PoseNet可以利用單姿態(tài)或多姿態(tài)算法檢測圖像和視頻中的人物,所有這些都可以在瀏覽器中實現(xiàn)。

PoseNet的姿態(tài)估計分兩個階段進行:

將一個RGB圖像作為輸入,輸入給卷積神經(jīng)網(wǎng)絡(luò)。

利用單姿態(tài)或多姿態(tài)解碼算法解碼來解碼模型輸出中的姿態(tài)、姿態(tài)置信度分數(shù)、關(guān)鍵點位置和關(guān)鍵點置信度分數(shù)。

PoseNet返回檢測到的每個人的置信度值以及檢測到的每個姿勢關(guān)鍵點。

https://medium.com/tensorflow/real-time-human-pose-estimation-in-the-browser-with-tensorflow-js-7dd0bc881cd5

8.用Keras進行多標簽分類

這是一個關(guān)于多標簽分類的Keras教程,包括以下4個部分:

討論多標簽分類數(shù)據(jù)集(以及如何快速構(gòu)建自己的分類數(shù)據(jù)集)。

簡要討論SmallerVGGNet,這是將用來實現(xiàn)多標簽分類的Keras神經(jīng)網(wǎng)絡(luò)架構(gòu)。

實現(xiàn)SmallerVGGNet,并使用多標簽分類數(shù)據(jù)集對其進行訓練。

最后,在示例圖像上測試網(wǎng)絡(luò),并討論一些注意事項

https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras

9.谷歌地標檢索挑戰(zhàn)賽:第一名解決方案解讀

四個月前,谷歌在Kaggle發(fā)布了一項地標檢索挑戰(zhàn)賽(Google Landmark Retrieval Challenge),參賽者被要求在所有圖像數(shù)據(jù)集中檢索到含有給定圖像中地標的圖片。

這篇文章是第一名團隊的解決方案總結(jié),包括兩個主要部分:

首先,創(chuàng)建一個高性能的全局描述符(global descriptor),它可以將數(shù)據(jù)集中的圖像表示為奇異向量(singular vector);

然后,創(chuàng)建一個高效框架,將這些向量和最可能的圖像匹配,最后提交到積分榜上。

以下是一個流程圖,每一步都標記LB分數(shù)。

https://www.kaggle.com/c/landmark-retrieval-challenge/discussion/57855

10.學會“夜視”

這是伊利諾伊大學香檳分校(UIUC)和Intel Labs合作的論文,提出一個基于端到端訓練的用全卷積網(wǎng)絡(luò)進行低照度圖像處理的模型。這個網(wǎng)絡(luò)直接處理原始傳感器數(shù)據(jù),并且基本不使用傳統(tǒng)的圖像處理流程。

兩個大型新數(shù)據(jù)集

伯克利大學發(fā)布大型駕駛視頻數(shù)據(jù)集BDD100K

伯克利大學發(fā)布了BDD100K,這是目前為止最大規(guī)模也是最多樣化的駕駛視頻數(shù)據(jù)集。這些數(shù)據(jù)具有四個主要特征:大規(guī)模,多樣化,在真實的街道采集,并帶有時間信息。利用這個數(shù)據(jù)集,你還可以參加伯克利在CVPR 2018舉辦的自動駕駛競賽。

地址:http://bair.berkeley.edu/blog/2018/05/30/bdd/

骨骼X-ray數(shù)據(jù)集

Andrew Ng帶領(lǐng)的斯坦福大學ML團隊發(fā)布了一個目前為止最大規(guī)模的醫(yī)學影像數(shù)據(jù)集MURA(musculoskeletal radiographs),這個數(shù)據(jù)集包含4萬多張多角度射線檢測圖像,來自對12173名病人的14863項研究,X光影像包含人體上肢的7個部分:肘、指、小臂、手、肱、肩、腕。最近,該團隊推出了基于此數(shù)據(jù)集的識別挑戰(zhàn)賽:MURA骨骼X-ray深度學習競賽。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1762

    瀏覽量

    57505
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100713
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8406

    瀏覽量

    132561

原文標題:5月機器學習TOP 10熱文: Google Duplex,“換臉術(shù)”、網(wǎng)格單元(附文章地址)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌語音助理服務(wù)新功能:可為用戶整合日常有用信息

      導讀:近日,谷歌宣布為其語音助理服務(wù)Google Assistant推出一種新功能,向客戶提供日??赡苡玫降母鞣N信息的“可視化快照”。   谷歌周二宣布為其語音助理服務(wù)Google
    發(fā)表于 07-19 09:27

    Google Assistant搭配Google Duplex技術(shù)就能成為智能音箱霸主

    Google、亞馬遜和蘋果三大廠商力拚智能音箱市場,因整合了多項技術(shù),根據(jù)研調(diào)機構(gòu)Canalys的調(diào)查結(jié)果,智能音箱霸主在第1季換手,首度由Google Home系列產(chǎn)品取代Amazon Echo
    發(fā)表于 05-31 09:14 ?2295次閱讀

    Google Assistant即將登陸Wear OS

    Assistant功能也變得更加強大。在今天發(fā)表的官方博文中,Google預告了即將登陸Wear OS的諸多Google Assistant
    的頭像 發(fā)表于 06-14 09:45 ?3596次閱讀

    沃爾瑪借助Google Assistant來推動語音雜貨店的啟動

    沃爾瑪宣布,其客戶很快將能夠使用語音命令和Google Assistant購買雜貨。該功能將在支持Google Assistant的任何設(shè)備
    發(fā)表于 11-22 10:32 ?931次閱讀

    Google Assistant活躍用戶超五億,將推出新功能

    在亞馬遜宣布整合 Alexa 語音助手的設(shè)備突破 1 億之后,Google 宣布它的語音助手 Google Assistant 活躍用戶超過了五億。
    的頭像 發(fā)表于 01-09 15:38 ?2422次閱讀

    使用Google Assistant的燈光監(jiān)控系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant的燈光監(jiān)控系統(tǒng).zip》資料免費下載
    發(fā)表于 11-24 10:43 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的燈光監(jiān)控系統(tǒng)

    使用Google Assistant監(jiān)控室溫

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant監(jiān)控室溫.zip》資料免費下載
    發(fā)表于 12-13 09:23 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>監(jiān)控室溫

    通過Google Assistant控制燈光

    電子發(fā)燒友網(wǎng)站提供《通過Google Assistant控制燈光.zip》資料免費下載
    發(fā)表于 12-16 10:14 ?0次下載
    通過<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制燈光

    使用Google Assistant的警報系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant的警報系統(tǒng).zip》資料免費下載
    發(fā)表于 12-22 16:55 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的警報系統(tǒng)

    基于Google Assistant的中繼控制

    電子發(fā)燒友網(wǎng)站提供《基于Google Assistant的中繼控制.zip》資料免費下載
    發(fā)表于 01-31 14:35 ?0次下載
    基于<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的中繼控制

    什么是雙工技術(shù)?有哪些雙工方式?

    鴿子從A驛站到B驛站,或者從B驛站到A驛站,這兩個方向的信息在交互協(xié)調(diào)的過程就是雙工技術(shù)。
    發(fā)表于 05-18 14:29 ?6675次閱讀
    什么是<b class='flag-5'>雙工技術(shù)</b>?有哪些<b class='flag-5'>雙工</b>方式?

    Google Assistant控制的Jarvis

    電子發(fā)燒友網(wǎng)站提供《由Google Assistant控制的Jarvis.zip》資料免費下載
    發(fā)表于 06-29 14:55 ?0次下載
    由<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制的Jarvis

    Google Assistant語音控制開關(guān)

    電子發(fā)燒友網(wǎng)站提供《Google Assistant語音控制開關(guān).zip》資料免費下載
    發(fā)表于 06-30 15:11 ?0次下載
    <b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>語音控制開關(guān)

    使用Google Assistant控制蜂鳴器

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant控制蜂鳴器.zip》資料免費下載
    發(fā)表于 07-04 11:28 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制蜂鳴器

    使用Google Assistant和IFTTT控制蜂鳴器

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant和IFTTT控制蜂鳴器.zip》資料免費下載
    發(fā)表于 07-04 10:06 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>和IFTTT控制蜂鳴器
    RM新时代网站-首页