淺談深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的三大瓶頸

一片欣欣向榮背后，深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至。

提出這個(gè)觀點(diǎn)的，不是外人，正是計(jì)算機(jī)視覺奠基者之一，約翰霍普金斯大學(xué)教授Alan Yuille，他還是霍金的弟子。

他說，現(xiàn)在做AI不提神經(jīng)網(wǎng)絡(luò)，成果都很難發(fā)表了，這不是個(gè)好勢(shì)頭。

如果人們只追神經(jīng)網(wǎng)絡(luò)的潮流，拋棄所有老方法；如果人們只會(huì)刷榜，不去想怎樣應(yīng)對(duì)深度網(wǎng)絡(luò)的局限性，這個(gè)領(lǐng)域可能很難有更好的發(fā)展。

面對(duì)深度學(xué)習(xí)的三大瓶頸，Yuille教授給出兩條應(yīng)對(duì)之道：靠組合模型培養(yǎng)泛化能力，用組合數(shù)據(jù)測(cè)試潛在的故障。

觀點(diǎn)發(fā)表之后，引發(fā)不少的共鳴。Reddit話題熱度快速超過200，學(xué)界業(yè)界的AI科學(xué)家們也紛紛在Twitter上轉(zhuǎn)發(fā)。

Reddit網(wǎng)友評(píng)論道，以Yuille教授的背景，他比別人更清楚在深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域現(xiàn)狀如何，為什么出現(xiàn)瓶頸。

深度學(xué)習(xí)的三大瓶頸

Yuille指出，深度學(xué)習(xí)雖然優(yōu)于其他技術(shù)，但它不是通用的，經(jīng)過數(shù)年的發(fā)展，它的瓶頸已經(jīng)凸顯出來，主要有三個(gè)：

需要大量標(biāo)注數(shù)據(jù)

深度學(xué)習(xí)能夠?qū)崿F(xiàn)的前提是大量經(jīng)過標(biāo)注的數(shù)據(jù)，這使得計(jì)算機(jī)視覺領(lǐng)域的研究人員傾向于在數(shù)據(jù)資源豐富的領(lǐng)域搞研究，而不是去重要的領(lǐng)域搞研究。

雖然有一些方法可以減少對(duì)數(shù)據(jù)的依賴，比如遷移學(xué)習(xí)、少樣本學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)。但是到目前為止，它們的性能還沒法與監(jiān)督學(xué)習(xí)相比。

過度擬合基準(zhǔn)數(shù)據(jù)

深度神經(jīng)網(wǎng)絡(luò)在基準(zhǔn)數(shù)據(jù)集上表現(xiàn)很好，但在數(shù)據(jù)集之外的真實(shí)世界圖像上，效果就差強(qiáng)人意了。

一個(gè)用ImageNet訓(xùn)練來識(shí)別沙發(fā)的深度神經(jīng)網(wǎng)絡(luò)，如果沙發(fā)擺放角度特殊一點(diǎn)，就認(rèn)不出來了。這是因?yàn)?，有些角度在ImageNet數(shù)據(jù)集里很少見。

在實(shí)際的應(yīng)用中，如果深度網(wǎng)絡(luò)有偏差，將會(huì)帶來非常嚴(yán)重的后果。

要知道，用來訓(xùn)練自動(dòng)駕駛系統(tǒng)的數(shù)據(jù)集中，基本上從來沒有坐在路中間的嬰兒。

對(duì)圖像變化過度敏感

深度神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)準(zhǔn)的對(duì)抗性攻擊很敏感，這些攻擊會(huì)對(duì)圖像造成人類難以察覺的變化，但可能會(huì)改變神經(jīng)網(wǎng)絡(luò)對(duì)一個(gè)物體的認(rèn)知。

而且，神經(jīng)網(wǎng)絡(luò)對(duì)場景的變化也過于敏感。比如下面的這張圖，在猴子圖片上放了吉他等物體，神經(jīng)網(wǎng)絡(luò)就將猴子識(shí)別成了人類，吉他識(shí)別成了鳥類。

背后的原因是，與猴子相比，人類更有可能攜帶吉他，與吉他相比，鳥類更容易出現(xiàn)在叢林中。

這種對(duì)場景的過度敏感，原因在于數(shù)據(jù)集的限制。

對(duì)于任何一個(gè)目標(biāo)對(duì)象，數(shù)據(jù)集中只有有限數(shù)量的場景。在實(shí)際的應(yīng)用中，神經(jīng)網(wǎng)絡(luò)會(huì)明顯偏向這些場景。

對(duì)于像深度神經(jīng)網(wǎng)絡(luò)這樣數(shù)據(jù)驅(qū)動(dòng)的方法來說，很難捕捉到各種各樣的場景，以及各種各樣的干擾因素。

想讓深度神經(jīng)網(wǎng)絡(luò)處理所有的問題，似乎需要一個(gè)無窮大的數(shù)據(jù)集，這就給訓(xùn)練和測(cè)試數(shù)據(jù)集帶來了巨大的挑戰(zhàn)。

為什么數(shù)據(jù)集會(huì)不夠大？

這三大問題，還殺不死深度學(xué)習(xí)，但它們都是需要警惕的信號(hào)。

Yuille說，瓶頸背后的原因，就是一個(gè)叫做“組合爆炸”的概念：

就說視覺領(lǐng)域，真實(shí)世界的圖像，從組合學(xué)觀點(diǎn)來看太大量了。任何一個(gè)數(shù)據(jù)集，不管多大，都很難表達(dá)出現(xiàn)實(shí)的復(fù)雜程度。

那么，組合學(xué)意義上的大，是個(gè)什么概念？

大家想象一下，現(xiàn)在要搭建一個(gè)視覺場景：你有一本物體字典，要從字典里選出各種各樣的物體，把它們放到不同的位置上。

說起來容易，但每個(gè)人選擇物體、擺放物體的方法都不一樣，搭出的場景數(shù)量是可以指數(shù)增長的。

就算只有一個(gè)物體，場景還是能指數(shù)增長。因?yàn)?，它可以用千奇百怪的方式被遮擋；物體所在的背景也有無窮多種。

人類的話，能夠自然而然適應(yīng)背景的變化；但深度神經(jīng)網(wǎng)絡(luò)對(duì)變化就比較敏感了，也更容易出錯(cuò)：

△?是的，前面出現(xiàn)過了

也不是所有視覺任務(wù)都會(huì)發(fā)生組合爆炸?(Combinatorial Explosion) 。

比如，醫(yī)學(xué)影像就很適合用深度網(wǎng)絡(luò)來處理，因?yàn)楸尘吧儆凶兓罕热?，胰腺通常都?huì)靠近十二指腸。

但這樣的應(yīng)用并不常見，復(fù)雜多變的情況在現(xiàn)實(shí)中更普遍。如果沒有指數(shù)意義上的大數(shù)據(jù)集，就很難模擬真實(shí)情況。

而在有限的數(shù)據(jù)集上訓(xùn)練/測(cè)試出來的模型，會(huì)缺乏現(xiàn)實(shí)意義：因?yàn)閿?shù)據(jù)集不夠大，代表不了真實(shí)的數(shù)據(jù)分布。

那么，就有兩個(gè)新問題需要重視：

1、怎樣在有限的數(shù)據(jù)集里訓(xùn)練，才能讓AI在復(fù)雜的真實(shí)世界里也有很好的表現(xiàn)？

2、怎樣在有限的數(shù)據(jù)集里，高效地給算法做測(cè)試，才能保證它們承受得了現(xiàn)實(shí)里大量數(shù)據(jù)的考驗(yàn)？

組合爆炸如何應(yīng)對(duì)？

數(shù)據(jù)集是不會(huì)指數(shù)型長大的，所以要試試從別的地方突破。

可以訓(xùn)練一個(gè)組合模型，培養(yǎng)泛化能力。也可以用組合數(shù)據(jù)來測(cè)試模型，找出容易發(fā)生的故障。

總之，組合是關(guān)鍵。

訓(xùn)練組合模型

組合性 (Compositionality) 是指，一個(gè)復(fù)雜的表達(dá)，它的意義可以通過各個(gè)組成部分的意義來決定。

這里，一個(gè)重要的假設(shè)就是，一個(gè)結(jié)構(gòu)是由許多更加基本的子結(jié)構(gòu)，分層組成的；背后有一些語法規(guī)則。

這就表示，AI可以從有限的數(shù)據(jù)里，學(xué)會(huì)那些子結(jié)構(gòu)和語法，再泛化到各種各樣的情景里。

與深度網(wǎng)絡(luò)不同，組合模型 (Compositional Models) 需要結(jié)構(gòu)化的表示方式，才能讓結(jié)構(gòu)和子結(jié)構(gòu)更明確。

組合模型的推斷能力，可以延伸到AI見過的數(shù)據(jù)之外：推理、干預(yù)、診斷，以及基于現(xiàn)有知識(shí)結(jié)構(gòu)去回答不同的問題。

引用Stuart German的一句話：

The world is compositional or God exists. 世界是組合性的，不然，上帝就是存在的。

雖然，深度神經(jīng)網(wǎng)絡(luò)也有些組合性：高級(jí)特征是由低級(jí)特征的響應(yīng)組成的；但在本文所討論的意義上，深度神經(jīng)網(wǎng)絡(luò)并不是組合性的。

組合模型的優(yōu)點(diǎn)已經(jīng)在許多視覺任務(wù)里面體現(xiàn)了：比如2017年登上Science的、用來識(shí)別CAPTCHA驗(yàn)證碼的模型。

還有一些理論上的優(yōu)點(diǎn)，比如可解釋，以及可以生成樣本。這樣一來，研究人員就更加容易發(fā)現(xiàn)錯(cuò)誤在哪，而不像深度神經(jīng)網(wǎng)絡(luò)是個(gè)黑盒，誰也不知道里面發(fā)生了什么。

但要學(xué)習(xí)組合模型，并不容易。因?yàn)檫@里需要學(xué)習(xí)所有的組成部分和語法；

還有，如果要通過合成 (Synthesis) 來作分析，就需要有生成模型?(Generative Models) 來生成物體和場景結(jié)構(gòu)。

就說圖像識(shí)別，除了人臉、字母等等少數(shù)幾種很有規(guī)律的圖案之外，其他物體還很難應(yīng)付：

從根本上說，要解決組合爆炸的問題，就要學(xué)習(xí)3D世界的因果模型?(Causal Models) ，以及這些模型是如何生成圖像的。

有關(guān)人類嬰兒的研究顯示，他們是通過搭建因果模型來學(xué)習(xí)的，而這些模型可以預(yù)測(cè)他們生活環(huán)境的結(jié)構(gòu)。

對(duì)因果關(guān)系的理解，可以把從有限數(shù)據(jù)里學(xué)到的知識(shí)，有效擴(kuò)展到新場景里去。

在組合數(shù)據(jù)里測(cè)試模型

訓(xùn)練過后，該測(cè)試了。

前面說過，世界那么復(fù)雜，而我們只能在有限的數(shù)據(jù)上測(cè)試算法。

要處理組合數(shù)據(jù) (Combinatorial Data) ，博弈論是一種重要的方法：它專注于最壞情況?(Worst Case) ，而不是平均情況 (Average Case) 。

就像前面討論過的那樣，如果數(shù)據(jù)集沒有覆蓋到問題的組合復(fù)雜性，用平均情況討論出的結(jié)果可能缺乏現(xiàn)實(shí)意義。

而關(guān)注最壞情況，在許多場景下都是有意義的：比如自動(dòng)駕駛汽車的算法，比如癌癥診斷的算法。因?yàn)樵谶@些場景下，算法故障可能帶來嚴(yán)重的后果。

如果，能在低維空間里捕捉到故障模式 (Failure Modes) ，比如立體視覺的危險(xiǎn)因子 (Hazard Factors) ，就能用圖形和網(wǎng)格搜索來研究這些故障。

但是對(duì)于大多數(shù)視覺任務(wù)，特別是那些涉及組合數(shù)據(jù)的任務(wù)，通常不會(huì)有能找出幾個(gè)危險(xiǎn)因子、隔離出來單獨(dú)研究的簡單情況。

△?對(duì)抗攻擊：稍稍改變紋理，只影響AI識(shí)別，不影響人類

有種策略，是把標(biāo)準(zhǔn)對(duì)抗攻擊?(Adversarial Attacks) 的概念擴(kuò)展到包含非局部結(jié)構(gòu)?(Non-Local Structure) ，支持讓圖像或場景發(fā)生變化的復(fù)雜運(yùn)算，比如遮擋，比如改變物體表面的物理性質(zhì)，但不要對(duì)人類的認(rèn)知造成重大改變。

把這樣的方法應(yīng)用到視覺算法上，還是很有挑戰(zhàn)性的。

不過，如果算法是用組合性?(Compositional) 的思路來寫，清晰的結(jié)構(gòu)可能會(huì)給算法故障檢測(cè)帶來很大的幫助。

關(guān)于Alan Yuille

Alan Yuille，目前就職于約翰霍普金斯大學(xué)，是認(rèn)知科學(xué)和計(jì)算機(jī)科學(xué)的杰出教授。

1976年，在劍橋大學(xué)數(shù)學(xué)專業(yè)獲得學(xué)士學(xué)位。之后師從霍金，在1981年獲得理論物理博士學(xué)位。

畢業(yè)之后，轉(zhuǎn)而開拓計(jì)算機(jī)視覺領(lǐng)域。并先后就職于麻省理工學(xué)院的人工智能實(shí)驗(yàn)室，哈佛大學(xué)計(jì)算機(jī)系等等學(xué)術(shù)機(jī)構(gòu)。

2002年加入U(xiǎn)CLA，之后擔(dān)任視覺識(shí)別與機(jī)器學(xué)習(xí)中心主任，同時(shí)也在心理學(xué)系，計(jì)算機(jī)系，精神病學(xué)和生物行為學(xué)系任客座教授。

2016年，加入約翰霍普金斯大學(xué)。

他曾獲得ICCV的最佳論文獎(jiǎng)，2012年，擔(dān)任計(jì)算機(jī)視覺頂級(jí)會(huì)議CVPR的主席，計(jì)算機(jī)視覺界的奠基人之一。

此外，Alan Yuille也直接影響了中國AI的發(fā)展，其嫡系弟子朱瓏博士學(xué)成后，回國創(chuàng)辦了AI公司依圖科技，現(xiàn)在也是中國CV領(lǐng)域最知名的創(chuàng)業(yè)公司之一。

這篇文章中的觀點(diǎn)，出自Yuille在2018年5月發(fā)表的一篇論文，共同作者是他的博士生Chenxi Liu，在今年一月份，他們對(duì)這篇論文進(jìn)行了更新。

作者：mileistone?

因?yàn)槲覍?duì)計(jì)算機(jī)視覺比較熟，就從計(jì)算機(jī)視覺的角度說一下自己對(duì)深度學(xué)習(xí)瓶頸的看法。

一、深度學(xué)習(xí)缺乏理論支撐大多數(shù)文章的idea都是靠直覺提出來的，背后的很少有理論支撐。通過實(shí)驗(yàn)驗(yàn)證有效的idea，不一定是最優(yōu)方向。就如同最優(yōu)化問題中的sgd一樣，每一個(gè)step都是最優(yōu)，但從全局來看，卻不是最優(yōu)。

沒有理論支撐的話，計(jì)算機(jī)視覺領(lǐng)域的進(jìn)步就如同sgd一樣，雖然有效，但是緩慢；如果有了理論支撐，計(jì)算機(jī)視覺領(lǐng)域的進(jìn)步就會(huì)像牛頓法一樣，有效且迅猛。

CNN模型本身有很多超參數(shù)，比如設(shè)置幾層，每一層設(shè)置幾個(gè)filter，每個(gè)filter是depth wise還是point wise，還是普通conv，filter的kernel size設(shè)置多大等等。

這些超參數(shù)的組合是一個(gè)很大的數(shù)字，如果只靠實(shí)驗(yàn)來驗(yàn)證，幾乎是不可能完成的。最后只能憑直覺試其中一部分組合，因此現(xiàn)在的CNN模型只能說效果很好，但是絕對(duì)還沒達(dá)到最優(yōu)，無論是效果還是效率。

以效率舉例，現(xiàn)在resnet效果很好，但是計(jì)算量太大了，效率不高。然而可以肯定的是resnet的效率可以提高，因?yàn)閞esnet里面肯定有冗余的參數(shù)和冗余的計(jì)算，只要我們找到這些冗余的部分，并將其去掉，效率自然提高了。一個(gè)最簡單而且大多人會(huì)用的方法就是減小各層channel的數(shù)目。

如果一套理論可以估算模型的capacity，一個(gè)任務(wù)所需要模型的capacity。那我們面對(duì)一個(gè)任務(wù)的時(shí)候，使用capacity與之匹配的模型，就能使得效果好，效率優(yōu)。

二、領(lǐng)域內(nèi)越來越工程師化思維因?yàn)樯疃葘W(xué)習(xí)本身缺乏理論，深度學(xué)習(xí)理論是一塊難啃的骨頭，深度學(xué)習(xí)框架越來越傻瓜化，各種模型網(wǎng)上都有開源實(shí)現(xiàn)，現(xiàn)在業(yè)內(nèi)很多人都是把深度學(xué)習(xí)當(dāng)樂高用。

面對(duì)一個(gè)任務(wù)，把當(dāng)前最好的幾個(gè)模型的開源實(shí)現(xiàn)git clone下來，看看這些模型的積木搭建說明書（也就是論文），思考一下哪塊積木可以改一改，積木的順序是否能調(diào)換一樣，加幾個(gè)積木能不能讓效果更好，減幾個(gè)積木能不能讓效率更高等等。

思考了之后，實(shí)驗(yàn)跑起來，實(shí)驗(yàn)效果不錯(cuò)，文章發(fā)起來，實(shí)驗(yàn)效果不如預(yù)期，重新折騰一遍。

這整個(gè)過程非常的工程師化思維，基本就是憑感覺trial and error，深度思考缺位。很少有人去從理論的角度思考模型出了什么問題，針對(duì)這個(gè)問題，模型應(yīng)該做哪些改進(jìn)。

舉一個(gè)極端的例子，一個(gè)數(shù)據(jù)實(shí)際上是一次函數(shù)，但是我們卻總二次函數(shù)去擬合，發(fā)現(xiàn)擬合結(jié)果不好，再用三次函數(shù)擬合，三次不行，四次，再不行，就放棄。我們很少思考，這個(gè)數(shù)據(jù)是啥分布，針對(duì)這樣的分布，有沒有函數(shù)能擬合它，如果有，哪個(gè)函數(shù)最合適。

深度學(xué)習(xí)本應(yīng)該是一門科學(xué)，需要用科學(xué)的思維去面對(duì)她，這樣才能得到更好的結(jié)果。

三、對(duì)抗樣本是深度學(xué)習(xí)的問題，但不是深度學(xué)習(xí)的瓶頸我認(rèn)為對(duì)抗樣本雖然是深度學(xué)習(xí)的問題，但并不是深度學(xué)習(xí)的瓶頸。機(jī)器學(xué)習(xí)中也有對(duì)抗樣本，機(jī)器學(xué)習(xí)相比深度學(xué)習(xí)有著更多的理論支撐，依然沒能把對(duì)抗樣本的問題解決。

之所以我們覺得對(duì)抗樣本是深度學(xué)習(xí)的瓶頸是因?yàn)椋瑘D像很直觀，當(dāng)我們看到兩張幾乎一樣的圖片，最后深度學(xué)習(xí)模型給出兩種完全不一樣的分類結(jié)果，這給我們的沖擊很大。

如果修改一個(gè)原本類別是A的feature中某個(gè)元素的值，然后使得svm的分類改變?yōu)锽，我們會(huì)覺得不以為然，“你改變了這個(gè)feature中某個(gè)元素的值，它的分類結(jié)果改變很正常啊”。

作者：PENG Bo?

個(gè)人認(rèn)為，當(dāng)前深度學(xué)習(xí)的瓶頸，可能在于 scaling。是的，你沒有聽錯(cuò)。

我們已經(jīng)有海量的數(shù)據(jù)，海量的算力，但我們卻難以訓(xùn)練大型的深度網(wǎng)絡(luò)模型（GB 到 TB 級(jí)別的模型），因?yàn)?BP 難以大規(guī)模并行化。數(shù)據(jù)并行不夠，用模型并行后加速比就會(huì)大打折扣。即使在加入諸多改進(jìn)后，訓(xùn)練過程對(duì)帶寬的要求仍然太高。

這就是為什么 nVidia 的 DGX-2 只有 16 塊 V100，但就是要賣到 250 萬。因?yàn)殡m然用少得多的錢就可以湊出相同的總算力，但很難搭出能高效運(yùn)用如此多張顯卡的機(jī)器。

而且 DGX-2 內(nèi)部的 GPU 也沒有完全互聯(lián)：

又例如 AlphaGo Zero 的訓(xùn)練，實(shí)際用于訓(xùn)練的只是很少的 TPU。即使有幾千幾萬張 TPU，也并沒有辦法將他們高效地用于訓(xùn)練網(wǎng)絡(luò)。

如果什么時(shí)候深度學(xué)習(xí)可以無腦堆機(jī)器就能不斷提高訓(xùn)練速度（就像挖礦可以堆礦機(jī)），從而可以用超大規(guī)模的多任務(wù)網(wǎng)絡(luò)，學(xué)會(huì) PB EB 級(jí)別的各類數(shù)據(jù)，那么所能實(shí)現(xiàn)的效果很可能會(huì)是令人驚訝的。

那么我們看現(xiàn)在的帶寬：

https://en.wikipedia.org/wiki/List_of_interface_bit_rates

2011年出了PCI-E 3.0 x16，是 15.75 GB/s，現(xiàn)在消費(fèi)級(jí)電腦還是這水平，4.0還是沒出來，不過可能是因?yàn)榇蠹覜]動(dòng)力（游戲?qū)捯鬀]那么高）。

NVLink 2.0是 150 GB/s，對(duì)于大型并行化還是完全不夠的。

大家可能會(huì)說，帶寬會(huì)慢慢提上來的。

很好，那么，這就來到了最奇怪的問題，我想這個(gè)問題值得思考：

AI芯片花了這么大力氣還是帶寬受限，那么人腦為何沒有受限于帶寬？

我的想法是：

人腦的并行化做得太好了，因此神經(jīng)元之間只需要kB級(jí)的帶寬。值得AI芯片和算法研究者學(xué)習(xí)。

人腦的學(xué)習(xí)方法比BP粗糙得多，所以才能這樣大規(guī)模并行化。

人腦的學(xué)習(xí)方法是去中心化的，個(gè)人認(rèn)為，更接近 energy-based 的方法。

人腦的其它特點(diǎn)，用現(xiàn)在的遷移學(xué)習(xí)+多任務(wù)學(xué)習(xí)+持續(xù)學(xué)習(xí)已經(jīng)可以模仿。

人腦還會(huì)用語言輔助思考。如果沒有語言，人腦也很難快速學(xué)會(huì)復(fù)雜的事情。

編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
計(jì)算機(jī)視覺(45543) 計(jì)算機(jī)視覺(45543)
深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)

評(píng)論

相關(guān)推薦

為何說計(jì)算機(jī)視覺已經(jīng)成為新時(shí)代風(fēng)向標(biāo)

目前，人工智能，機(jī)器學(xué)習(xí)，深度學(xué)習(xí)，計(jì)算機(jī)視覺等已經(jīng)成為新時(shí)代的風(fēng)向標(biāo)。這篇文章主要介紹了下面幾點(diǎn)：第一點(diǎn)，如果說你要入門計(jì)算機(jī)視覺，需要了解哪一些基礎(chǔ)知識(shí)？第二點(diǎn)，既然你要往這方面學(xué)習(xí)

2018-08-29 09:49:24

4315

計(jì)算機(jī)視覺多領(lǐng)域應(yīng)用，加速物聯(lián)網(wǎng)時(shí)代步伐！

智能物聯(lián)網(wǎng)的下一個(gè)階段，必將是通過計(jì)算機(jī)視覺和深度學(xué)習(xí)等技術(shù)使“事物”更加智能，從而產(chǎn)生更多可操作的數(shù)據(jù)。

2017-11-15 06:37:00

6458

在計(jì)算機(jī)與第三方設(shè)備通信時(shí)，常用的計(jì)算機(jī)編碼

在計(jì)算機(jī)與第三方設(shè)備通信時(shí)，常用的計(jì)算機(jī)編碼

2015-07-10 13:06:32

學(xué)習(xí)計(jì)算機(jī)視覺的建議有哪些

初學(xué)計(jì)算機(jī)視覺的切身建議

2020-06-18 10:12:53

淺談計(jì)算機(jī)的硬件維護(hù)

軟件系統(tǒng)的同時(shí),也應(yīng)該重視對(duì)于計(jì)算機(jī)硬件的維護(hù)。以下是學(xué)習(xí)啦小編為大家精心準(zhǔn)備的：淺談計(jì)算機(jī)的硬件維護(hù)相關(guān)論文。內(nèi)容僅供參考，歡迎閱讀!淺談計(jì)算機(jī)的硬件維護(hù)全文如下：摘要：現(xiàn)今科技的進(jìn)步日新月異，計(jì)算機(jī)作為...

2021-09-08 06:49:22

淺談計(jì)算機(jī)的硬件維護(hù)

隨著科學(xué)技術(shù)的飛速發(fā)展,計(jì)算機(jī)已經(jīng)走進(jìn)千家萬戶,在給人們的工作和生活帶來了便利的同時(shí),也在潛移默化地影響著人們的生活。計(jì)算機(jī)是由硬件系統(tǒng)和軟件系統(tǒng)組成的,是軟件和硬件的統(tǒng)一體,因此,人們在關(guān)心

2021-09-08 07:52:33

深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域圖像應(yīng)用總結(jié) 精選資料下載

突破的領(lǐng)域，真正讓大家大吃一驚的顛覆傳統(tǒng)方法的應(yīng)用領(lǐng)域是語音識(shí)別，做出來的公司是微軟，而不是當(dāng)時(shí)如日中天的谷歌。計(jì)算機(jī)視覺應(yīng)用深度學(xué)習(xí)堪稱突破的成功點(diǎn)是2012年ImageNet比賽，采用的模型...

2021-07-28 08:22:12

深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺簡介

文章目錄1 簡介1.1 深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計(jì)算機(jī)視覺領(lǐng)域中，不同的場景不同的應(yīng)用程序需要不同的解決方案。在本文中，我們將快速回顧可用于在

2021-12-23 06:17:19

深度學(xué)習(xí)是什么

創(chuàng)客們的最酷“玩具”　　智能無人機(jī)、自主機(jī)器人、智能攝像機(jī)、自動(dòng)駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后，幾乎都和計(jì)算機(jī)視覺與深度學(xué)習(xí)密切相關(guān)?！　?b class="flag-6" style="color: red">深度學(xué)習(xí)

2021-07-19 06:17:28

計(jì)算機(jī)視覺/深度學(xué)習(xí)領(lǐng)域常用數(shù)據(jù)集匯總

、定位、檢測(cè)等研究工作大多基于此數(shù)據(jù)集展開。Imagenet數(shù)據(jù)集文檔詳細(xì)，有專門的團(tuán)隊(duì)維護(hù)，使用非常方便，在計(jì)算機(jī)視覺領(lǐng)域研究論文中應(yīng)用非常廣，幾乎成為了目前深度學(xué)習(xí)圖像領(lǐng)域算法性能檢驗(yàn)的“標(biāo)準(zhǔn)

2018-08-29 10:36:45

計(jì)算機(jī)視覺領(lǐng)域的關(guān)鍵技術(shù)/典型算法模型/通信工程領(lǐng)域的應(yīng)用方案

是計(jì)算機(jī)視覺行業(yè)發(fā)展的三大基石。2000年之后，數(shù)據(jù)量的上漲、運(yùn)算力的提升和深度學(xué)習(xí)算法的出現(xiàn)促進(jìn)了計(jì)算機(jī)視覺行業(yè)的迅猛發(fā)展。隨著高性能智能終端的普及以及影像采集設(shè)備成本的下降，通信行業(yè)逐漸在勘察、施工

2020-12-03 13:58:12

計(jì)算機(jī)視覺基礎(chǔ)知識(shí)

計(jì)算機(jī)視覺基礎(chǔ)題目

2020-06-05 16:33:34

計(jì)算機(jī)視覺應(yīng)用深度學(xué)習(xí)

怎樣從傳統(tǒng)機(jī)器學(xué)習(xí)方法過渡到深度學(xué)習(xí)？

2021-10-14 06:51:23

計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)資料全集

CV之YOLOv3：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)Yolov3-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄(第二次)——Jason niu

2018-12-24 11:52:25

計(jì)算機(jī)視覺論文速覽

AI視野·今日CS.CV 計(jì)算機(jī)視覺論文速覽transformer、新模型、視覺語言模型、多模態(tài)、clip、視角合成

2021-08-31 08:46:46

計(jì)算機(jī)應(yīng)用領(lǐng)域的劃分

計(jì)算機(jī)應(yīng)用領(lǐng)域的劃分小型專用型：玩具，汽車桌面通用型：電腦高端服務(wù)型：服務(wù)器**嵌入式系統(tǒng)的含義：**將計(jì)算機(jī)的硬件或者軟件嵌入到其他機(jī)電設(shè)備或者應(yīng)用系統(tǒng)中去，構(gòu)成的新的系統(tǒng)構(gòu)造原則：以應(yīng)用為中心

2021-10-27 07:08:39

CV之YOLOv3：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)Yolov3-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

CV之YOLOv3：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)Yolov3-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

2018-12-24 11:51:47

CV之YOLO：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)tiny-yolo-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

CV之YOLO：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)tiny-yolo-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

2018-12-24 11:50:57

【我是電子發(fā)燒友】七步帶你認(rèn)識(shí)計(jì)算機(jī)視覺（Computer Vision）

的歷史，另外還學(xué)習(xí)到分割和識(shí)別、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的最新進(jìn)展。希望本文能幫助你在計(jì)算機(jī)視覺領(lǐng)域走得更遠(yuǎn)，學(xué)習(xí)得更加深入。作者：追夢(mèng)水手的博客出處：http://xilinx.eetrend.com/blog/11503`

2017-06-14 21:06:15

為什么說FPGA是機(jī)器深度學(xué)習(xí)的未來？

　　最近幾年數(shù)據(jù)量和可訪問性的迅速增長，使得人工智能的算法設(shè)計(jì)理念發(fā)生了轉(zhuǎn)變。人工建立算法的做法被計(jì)算機(jī)從大量數(shù)據(jù)中自動(dòng)習(xí)得可組合系統(tǒng)的能力所取代，使得計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等關(guān)鍵領(lǐng)域

2019-10-10 06:45:41

什么是計(jì)算機(jī)視覺看了就知道

什么是計(jì)算機(jī)視覺

2021-01-11 07:47:46

什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語言處理？

領(lǐng)域，包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理和其他幾個(gè)學(xué)科。首先，人工智能涉及使計(jì)算機(jī)具有自我意識(shí)，利用計(jì)算機(jī)視覺、自然語言理解和模仿其他感官。其次，人工智能涉及模仿人類的認(rèn)知功能

2022-03-22 11:19:16

口袋編程計(jì)算機(jī)

、順序、循環(huán)、判斷、事件、函數(shù)和數(shù)據(jù)結(jié)構(gòu)等等。同時(shí)采用交互式學(xué)習(xí)的方法、課堂練習(xí)、課后作業(yè)等形式，充分保證了學(xué)習(xí)檢查點(diǎn)、學(xué)習(xí)價(jià)值和學(xué)習(xí)深度。　　口袋編程計(jì)算機(jī)

2017-08-04 17:52:58

基于深度學(xué)習(xí)和計(jì)算機(jī)視覺的面部表情分析

、厭、悲、恐。將這一技能傳達(dá)給機(jī)器是一項(xiàng)復(fù)雜的任務(wù)。研究人員通過幾十年的工程設(shè)計(jì)，試圖編寫出能夠準(zhǔn)確識(shí)別一個(gè)特征的計(jì)算機(jī)程序，但不得不反復(fù)重新開始，以識(shí)別出只有細(xì)微差別的特征。如果不對(duì)機(jī)器進(jìn)行編程，而是教會(huì)機(jī)器精確識(shí)別情緒，這樣會(huì)如何呢？

2019-07-17 07:31:58

如何讓計(jì)算機(jī)視覺更進(jìn)一步接近人類視覺？

如何讓計(jì)算機(jī)視覺更進(jìn)一步接近人類視覺？

2021-06-01 06:27:08

機(jī)器視覺與計(jì)算機(jī)視覺的關(guān)系簡述

初涉機(jī)器視覺領(lǐng)域，總是容易將其與計(jì)算機(jī)視覺這一概念混淆。實(shí)際上兩者確實(shí)存在一定的相同之處，但也不能因此而將這兩者視為同一概念，因?yàn)檫@兩者還存在著顯著的差別。而與此同時(shí)，兩者也還有著密不可分的關(guān)系

2014-05-13 14:57:44

匯總 |計(jì)算機(jī)視覺系統(tǒng)學(xué)習(xí)資料下載精選資料分享

計(jì)算機(jī)視覺干貨資料，涉及相機(jī)標(biāo)定、三維重建、立體視覺、SLAM、深度學(xué)習(xí)、點(diǎn)云后處理、姿態(tài)估計(jì)、多視圖幾何、多傳感器融合等方向【計(jì)算...

2021-07-27 07:51:42

用于計(jì)算機(jī)視覺訓(xùn)練的圖像數(shù)據(jù)集介紹

用于計(jì)算機(jī)視覺訓(xùn)練的圖像數(shù)據(jù)集

2021-02-26 07:35:08

自動(dòng)駕駛系統(tǒng)要完成哪些計(jì)算機(jī)視覺任務(wù)？

Geiger 的研究主要集中在用于自動(dòng)駕駛系統(tǒng)的三維視覺理解、分割、重建、材質(zhì)與動(dòng)作估計(jì)等方面。他主導(dǎo)了自動(dòng)駕駛領(lǐng)域著名數(shù)據(jù)集 KITTI 及多項(xiàng)自動(dòng)駕駛計(jì)算機(jī)視覺任務(wù)的基準(zhǔn)體系建設(shè)，KITTI 是目前最大的用于自動(dòng)駕駛的計(jì)算機(jī)視覺公開數(shù)據(jù)集。

2020-07-30 06:49:20

讓機(jī)器“看見”—計(jì)算機(jī)視覺入門及實(shí)戰(zhàn) 第二期基礎(chǔ)技術(shù)篇

過優(yōu)異成績。其主要的興趣是關(guān)注人工智能特別是計(jì)算機(jī)視覺技術(shù)如何從技術(shù)、產(chǎn)品和商業(yè)角度在真實(shí)世界中大規(guī)模落地。主題簡介及亮點(diǎn)：本次直播，講者將介紹計(jì)算機(jī)視覺領(lǐng)域人臉檢測(cè)/跟蹤/定位/識(shí)別、文字識(shí)別、圖像分類

2018-09-04 17:56:31

請(qǐng)問計(jì)算機(jī)視覺與深度學(xué)習(xí)要看什么書？

計(jì)算機(jī)視覺與深度學(xué)習(xí)，看這本書就夠了

2020-05-21 12:43:42

超全！深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域應(yīng)用一覽（附鏈接）精選資料分享

這是一份深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的超全應(yīng)用預(yù)覽~簡單回顧的話，2006年Geof...

2021-07-28 07:35:25

CPCI計(jì)算機(jī)

Compacc 是基于PICMG 標(biāo)準(zhǔn)的工業(yè)用嵌入式計(jì)算機(jī)總線標(biāo)準(zhǔn)。蘇州惠普聯(lián)電子有限公司的CompactPCI 產(chǎn)品群是基于CPCI標(biāo)準(zhǔn)的嵌入式計(jì)算機(jī)的產(chǎn)品系列，它的商業(yè)化應(yīng)用及發(fā)展取決于國際插件式計(jì)算機(jī)，設(shè)備及其他硬件軟件的廣泛應(yīng)用。

2022-04-22 09:47:55

恩智浦i.MX8M PLUS 2.3T NPU工業(yè)邊緣計(jì)算機(jī)器學(xué)習(xí)與視覺應(yīng)用

恩智浦i.MX8M PLUS 2.3T NPU工業(yè)邊緣計(jì)算機(jī)器學(xué)習(xí)與視覺應(yīng)用啟揚(yáng)智能IAC-IMX8MP-CM核心板基于NXP首款集成NPU的i.MX8MPLus處理器設(shè)計(jì)開發(fā)，處理器集成四個(gè)主頻為

2022-07-29 11:55:28

計(jì)算機(jī)視覺及其在焊接中的應(yīng)用

簡要闡述了計(jì)算機(jī)視覺的基本原理、系統(tǒng)結(jié)構(gòu)和計(jì)算機(jī)視覺的基本處理方法，并著重講解了在焊接自動(dòng)化領(lǐng)域的應(yīng)用情況。關(guān)鍵詞：計(jì)算機(jī)視覺.焊縫跟蹤.視覺傳感器.圖像處理

2009-07-18 10:19:56

計(jì)算機(jī)視覺賈云德pdf版

計(jì)算機(jī)視覺

2017-05-09 11:00:42

計(jì)算機(jī)視覺倚靠幾何洞察發(fā)展

如今，深度學(xué)習(xí)已顛覆計(jì)算機(jī)視覺領(lǐng)域，端到端的深度學(xué)習(xí)模型幾乎是任何問題的最佳解決方案。尤其是卷積神經(jīng)網(wǎng)絡(luò)（CNN），因?yàn)樗Ч稳憾鴱V受歡迎?？墒牵@些深度學(xué)習(xí)模型都像是一個(gè)個(gè)黑盒子，盒子內(nèi)的奧秘

2017-09-30 10:11:28

計(jì)算機(jī)視覺應(yīng)用之OpenCV基礎(chǔ)教程

從工業(yè)檢測(cè)系統(tǒng)到自動(dòng)駕駛系統(tǒng)，計(jì)算機(jī)視覺是一個(gè)包括許多有趣應(yīng)用的廣泛領(lǐng)域。許多這樣的系統(tǒng)在原型和實(shí)現(xiàn)階段都要用到開源計(jì)算機(jī)視覺 (Open Source Computer Vision

2017-11-18 04:45:02

8950

介紹了計(jì)算機(jī)視覺領(lǐng)域內(nèi)比較成功的10個(gè)深度學(xué)習(xí)架構(gòu)

近年來，深度學(xué)習(xí)的發(fā)展勢(shì)頭迅猛，要跟上深度學(xué)習(xí)的進(jìn)步速度變得越來越困難了。幾乎每一天都有關(guān)于深度學(xué)習(xí)的創(chuàng)新，而大部分的深度學(xué)習(xí)創(chuàng)新都隱藏在那些發(fā)表于ArXiv和Spinger等研究論文中。簡潔起見，本文中只介紹了計(jì)算機(jī)視覺領(lǐng)域內(nèi)比較成功的深度學(xué)習(xí)架構(gòu)。

2018-01-11 10:49:06

8946

介紹深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域四大基本任務(wù)中的應(yīng)用

有關(guān)計(jì)算機(jī)視覺中分類、定位、檢測(cè)、和分割你需要知道的一切。

2018-01-24 16:25:45

10504

【干貨】計(jì)算機(jī)視覺必讀：目標(biāo)跟蹤、網(wǎng)絡(luò)壓縮、圖像分類、人臉識(shí)別等

深度學(xué)習(xí)應(yīng)用于計(jì)算機(jī)視覺，最新進(jìn)展梳理

2018-03-30 10:02:31

5565

深度學(xué)習(xí)是否會(huì)取代傳統(tǒng)的計(jì)算機(jī)視覺？

理解傳統(tǒng)的計(jì)算機(jī)視覺實(shí)際上真的有助于你更好的使用深度學(xué)習(xí)。例如，計(jì)算機(jī)視覺中最常見的神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)。但是什么是卷積？它實(shí)際上是一種廣泛使用的圖像處理技術(shù)（例如Sobel邊緣檢測(cè)）。了解卷積有助于了解神經(jīng)網(wǎng)絡(luò)的內(nèi)在機(jī)制，在解決問題時(shí)，它可以幫助你設(shè)計(jì)和調(diào)整模型。

2018-04-02 10:37:16

5949

深度學(xué)習(xí)不能取代計(jì)算機(jī)視覺技術(shù)背后的真正原因

深度學(xué)習(xí)只是一種 計(jì)算機(jī)視覺工具，而不是包治百病的良藥，不要因?yàn)榱餍芯鸵晃兜厥褂盟?。傳統(tǒng)的計(jì)算機(jī)視覺技術(shù)仍然可以大顯身手，了解它們可以為你省去很多的時(shí)間和煩惱；并且掌握傳統(tǒng)計(jì)算機(jī)視覺確實(shí)可以讓你在

2018-04-05 11:37:00

4520

新突破！超級(jí)計(jì)算機(jī)上深度學(xué)習(xí)訓(xùn)練時(shí)間縮減到數(shù)分鐘

微軟和瑞士國家計(jì)算中心（CSCS）的科學(xué)家們?nèi)〉昧酥卮笸黄疲瑢⒊?jí)計(jì)算機(jī)上深度學(xué)習(xí)的訓(xùn)練時(shí)間縮減到數(shù)分鐘。訓(xùn)練時(shí)間的縮短，再加上超級(jí)計(jì)算機(jī)技術(shù)的引入，或能夠解決現(xiàn)在在圖像、視頻和語音識(shí)別，自然語言

2018-05-11 12:55:00

2434

新計(jì)算機(jī)視覺公司在機(jī)器人、零售等新領(lǐng)域快速崛起

計(jì)算機(jī)視覺是人工智能在中國落地最順利的技術(shù)。和語音相比，計(jì)算機(jī)視覺是一條更有技術(shù)深度，更多應(yīng)用場景的好賽道。

2018-09-30 09:41:31

6827

計(jì)算機(jī)視覺與機(jī)器視覺區(qū)別

　“計(jì)算機(jī)視覺”，是指用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能，對(duì)客觀世界的三維場景的感知、識(shí)別和理解。計(jì)算機(jī)視覺是一個(gè)處于指示前沿的領(lǐng)域。我們認(rèn)為計(jì)算機(jī)視覺，或簡稱為“視覺”，是一項(xiàng)事業(yè)，它與研究人類或動(dòng)物的視覺是不同的。

2018-12-08 09:27:29

12006

以深度學(xué)習(xí)為核心的計(jì)算機(jī)視覺技術(shù)具有視覺美感嗎

我們看到了智能技術(shù)在影像辨識(shí)、偵測(cè)上的突破，甚至落地為產(chǎn)品。很多人問，這些深度學(xué)習(xí)為核心的計(jì)算機(jī)視覺技術(shù)也可以具有人類的美感—具有評(píng)判、編修、甚至美學(xué)創(chuàng)作的能力嗎？

2018-12-21 11:07:13

2130

為什么說現(xiàn)在是計(jì)算機(jī)視覺最好的時(shí)代？

隨著深度學(xué)習(xí)的迅猛發(fā)展，計(jì)算機(jī)視覺也成為了目前人工智能領(lǐng)域落地最順利的技術(shù)。計(jì)算機(jī)視覺（Computer Vision）是一門研究如何用攝影機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行跟蹤、識(shí)別、分析、處理

2019-07-29 18:27:32

2010

計(jì)算機(jī)視覺的興起與發(fā)展趨勢(shì)

近年來，為了使計(jì)算機(jī)更像人類，識(shí)別物體、深度學(xué)習(xí)等計(jì)算機(jī)視覺技術(shù)方法和應(yīng)用迅速發(fā)展，全球計(jì)算機(jī)視覺市場正在迅速崛起。隨著人工智能產(chǎn)業(yè)的升溫，計(jì)算機(jī)視覺行業(yè)也在加速擴(kuò)張。

2019-01-24 16:11:30

12846

深度學(xué)習(xí)“瓶頸”已至計(jì)算機(jī)視覺如何突破困局？

近期，計(jì)算機(jī)視覺奠基者之一，霍金的弟子，約翰霍普金斯大學(xué)教授Alan Yuille提出“深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至?！睆娜斯ぶ悄艿陌l(fā)展過程看，深度學(xué)習(xí)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一

2019-07-29 18:21:24

1165

SAS與英偉達(dá)在深度學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域開展合作

SAS與英偉達(dá)所展開的合作,將加速圖像識(shí)別和邊緣推理等關(guān)鍵功能的開發(fā)進(jìn)程中國北京,2019年3月21日近日,SAS宣布將與英偉達(dá)(NVIDIA)在深度學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域開展合作,共同助力

2019-03-22 13:51:15

476

計(jì)算機(jī)視覺就業(yè)怎么樣

計(jì)算機(jī)視覺是指用機(jī)器模擬“視覺器官”，對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等，并由計(jì)算機(jī)代替大腦完成進(jìn)一步的圖像處理和解釋。目前我們手機(jī)常用的人臉識(shí)別解鎖，銀行業(yè)務(wù)遠(yuǎn)程辦理等都是用的該類技術(shù)。計(jì)算機(jī)視覺方向目前的就業(yè)環(huán)境具體如何呢？

2019-04-04 16:06:24

14685

深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺到底是怎么樣的關(guān)系

如今，深度學(xué)習(xí)在眾多領(lǐng)域都有一席之地，尤其是在計(jì)算機(jī)視覺領(lǐng)域。盡管許多人都為之深深著迷，然而，深網(wǎng)就相當(dāng)于一個(gè)黑盒子，我們大多數(shù)人，甚至是該領(lǐng)域接受過培訓(xùn)的科學(xué)家，都不知道它們究竟是如何運(yùn)作的

2019-04-20 09:28:56

3608

深度學(xué)習(xí)改變的五大計(jì)算機(jī)視覺技術(shù)

摘要：本文主要介紹計(jì)算機(jī)視覺中主要的五大技術(shù)，分別為圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語義分割以及實(shí)例分割。

2019-07-05 09:51:28

3281

技術(shù) | 深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至

霍金的弟子，約翰霍普金斯大學(xué)教授Alan Yuille提出“深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至。

2019-07-05 10:07:38

2310

計(jì)算機(jī)視覺技術(shù)簡介

由于“計(jì)算機(jī)視覺”反映了對(duì)視覺環(huán)境及其上下文的相對(duì)理解，因此，一些科學(xué)家認(rèn)為，該領(lǐng)域為人工智能領(lǐng)域鋪平了道路。那么什么是計(jì)算機(jī)視覺呢？

2020-07-11 11:24:42

4079

深度學(xué)習(xí)后的計(jì)算機(jī)視覺應(yīng)用領(lǐng)域解析

計(jì)算機(jī)視覺是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺的一種模擬，是人工智能領(lǐng)域的一個(gè)重要部分，它主要任務(wù)是通過對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場景的信息。

2020-07-22 16:49:27

1707

計(jì)算機(jī)視覺的發(fā)展歷史_計(jì)算機(jī)視覺的應(yīng)用方向

計(jì)算機(jī)視覺40多年的發(fā)展中，盡管人們提出了大量的理論和方法，但總體上說，計(jì)算機(jī)視覺經(jīng)歷了4個(gè)主要?dú)v程。即：馬爾計(jì)算視覺、主動(dòng)和目的視覺、多視幾何與分層三維重建和基于學(xué)習(xí)的視覺。下面將對(duì)這4項(xiàng)主要內(nèi)容進(jìn)行簡要介紹。

2020-07-30 17:21:44

6145

計(jì)算機(jī)視覺常用算法_計(jì)算機(jī)視覺有哪些分類

本文主要介紹了計(jì)算機(jī)視覺常用算法及計(jì)算機(jī)視覺的分類。

2020-07-30 17:34:53

13013

基于計(jì)算機(jī)視覺的多維圖像智能

利用攝像機(jī)和其他數(shù)據(jù)源，計(jì)算機(jī)視覺可以收集有關(guān)公司運(yùn)營最重要方面的重要信息，這些信息包括構(gòu)成流程主干的人員、產(chǎn)品、資產(chǎn)和文檔的組合。當(dāng)企業(yè)收集數(shù)字圖像并應(yīng)用深度學(xué)習(xí)算法，通過對(duì)機(jī)器眼睛“所見”的反應(yīng)來準(zhǔn)確識(shí)別和分類對(duì)象時(shí)，計(jì)算機(jī)視覺起作用。

2020-08-04 10:39:42

2753

深度學(xué)習(xí)在計(jì)算機(jī)視覺上的四大應(yīng)用

計(jì)算機(jī)視覺中比較成功的深度學(xué)習(xí)的應(yīng)用，包括人臉識(shí)別，圖像問答，物體檢測(cè)，物體跟蹤。

2020-08-24 16:16:19

3971

計(jì)算機(jī)視覺的實(shí)現(xiàn)基本過程

計(jì)算機(jī)視覺的理念在某些方面其實(shí)與很多概念有部分重疊，包括：人工智能、數(shù)字圖像處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、模式識(shí)別、概率圖模型、科學(xué)計(jì)算以及一系列的數(shù)學(xué)計(jì)算等。

2020-09-24 10:49:32

6342

計(jì)算機(jī)視覺應(yīng)用中3大瓶頸問題及解決方案

/jig.190446 計(jì)算機(jī)視覺在智能制造工業(yè)檢測(cè)中發(fā)揮著檢測(cè)識(shí)別和定位分析的重要作用，為提高工業(yè)檢測(cè)的檢測(cè)速率和準(zhǔn)確率以及智能自動(dòng)化程度做出了巨大的貢獻(xiàn)。然而計(jì)算機(jī)視覺在應(yīng)用過程中一直存在技術(shù)應(yīng)用難點(diǎn)，其中3大瓶頸問題是： 計(jì)算機(jī)視覺應(yīng)用易受光照影響樣本數(shù)據(jù)難以支持深度學(xué)習(xí) 先驗(yàn)知識(shí)難以加入

2020-10-23 10:59:39

9344

為什么深度學(xué)習(xí)還沒有取代傳統(tǒng)計(jì)算機(jī)視覺技術(shù)？

本文作者認(rèn)為，深度學(xué)習(xí)只是一種計(jì)算機(jī)視覺工具，而不是包治百病的良藥，不要因?yàn)榱餍芯鸵晃兜厥褂盟?/div>

2020-10-23 11:24:31

1514

DL和傳統(tǒng)計(jì)算機(jī)視覺的比較

來自《Deep Learning vs. Traditional Computer Vision》摘要：深度學(xué)習(xí)推動(dòng)了數(shù)字圖像處理領(lǐng)域的極限。但是，這并不是說傳統(tǒng)計(jì)算機(jī)視覺技術(shù)已經(jīng)過時(shí)了。本文

2020-10-31 11:06:16

4781

如何快速學(xué)習(xí)計(jì)算機(jī)視覺圖像的分類

前言：計(jì)算機(jī)視覺是一門將圖像和視頻轉(zhuǎn)換成機(jī)器可理解信號(hào)的學(xué)科，有了這些信號(hào)，程序員可以基于這種高階進(jìn)一步控制機(jī)器的行為。在計(jì)算機(jī)視覺任務(wù)中，圖像分類是最基本的任務(wù)之一，它不僅可以用于許多真實(shí)的產(chǎn)品

2020-12-04 22:10:00

計(jì)算機(jī)視覺入門指南

出現(xiàn)，且它們可以集成到移動(dòng)應(yīng)用中。今天，由于其廣泛應(yīng)用和巨大潛力，計(jì)算機(jī)視覺成為最熱的人工智能和機(jī)器學(xué)習(xí)子領(lǐng)域之一。其目標(biāo)是：復(fù)制人類視覺的強(qiáng)大能力。但是，到底什么是計(jì)算機(jī)視覺？它在不同行業(yè)中的應(yīng)用現(xiàn)狀如何？知名的

2020-11-27 09:52:20

2546

四個(gè)計(jì)算機(jī)視覺領(lǐng)域用作遷移學(xué)習(xí)的模型

首發(fā)：AI公園公眾號(hào)作者：Orhan?G. Yal??n編譯：ronghuaiyang導(dǎo)讀使用SOTA的預(yù)訓(xùn)練模型來通過遷移學(xué)習(xí)解決現(xiàn)實(shí)的計(jì)算機(jī)視覺問題。如果你...

2020-12-15 00:07:30

346

計(jì)算機(jī)視覺與深度學(xué)習(xí)在AR中的應(yīng)用熱點(diǎn)趨勢(shì)有哪些

的小公司創(chuàng)業(yè)機(jī)會(huì)。那么，AR識(shí)別技術(shù)背后的算法原理是什么，以及計(jì)算機(jī)視覺與深度學(xué)習(xí)在AR中的應(yīng)用熱點(diǎn)趨勢(shì)有哪些？本次分享會(huì)從圖像特征提取、特征匹配與圖像變換、深度學(xué)習(xí)算法等方面給你進(jìn)行深入淺出的技術(shù)展現(xiàn)，讓AR識(shí)別技術(shù)不再成為難以逾越

2020-12-26 11:22:18

2505

如何通過深度學(xué)習(xí)來完成計(jì)算機(jī)視覺中的所有工作？

如今，深度學(xué)習(xí)是必經(jīng)之路。大規(guī)模數(shù)據(jù)集以及深層卷積神經(jīng)網(wǎng)絡(luò)（CNN）的表征能力可提供超準(zhǔn)確和強(qiáng)大的模型。但目前仍然只有一個(gè)挑戰(zhàn)：如何設(shè)計(jì)模型？像計(jì)算機(jī)視覺這樣廣泛而復(fù)雜的領(lǐng)域，解決方案并不總是清晰

2021-01-20 22:39:15

262

機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺的前20個(gè)圖像數(shù)據(jù)集

計(jì)算機(jī)視覺使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺的目標(biāo)是使人類視覺系統(tǒng)可以實(shí)現(xiàn)任務(wù)自動(dòng)化。計(jì)算機(jī)視覺任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式，例如視頻序列，從多個(gè)角度的不同的攝像機(jī)查看圖像或來自醫(yī)療掃描儀的多維數(shù)據(jù)。

2021-01-28 07:40:41

如何通過深度學(xué)習(xí)完成計(jì)算機(jī)視覺中的所有工作？

? 你想做計(jì)算機(jī)視覺嗎？如今，深度學(xué)習(xí)是必經(jīng)之路。大規(guī)模數(shù)據(jù)集以及深層卷積神經(jīng)網(wǎng)絡(luò)（CNN）的表征能力可提供超準(zhǔn)確和強(qiáng)大的模型。但目前仍然只有一個(gè)挑戰(zhàn)：如何設(shè)計(jì)模型？像計(jì)算機(jī)視覺這樣廣泛而復(fù)雜

2021-02-05 11:29:58

1455

如何通過深度學(xué)習(xí)，完成計(jì)算機(jī)視覺中的所有工作？

2021-03-01 09:39:56

基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)在醫(yī)療領(lǐng)域中的現(xiàn)狀與應(yīng)用

十年來，人工智能取得了前所未有的進(jìn)展，包括醫(yī)學(xué)在內(nèi)的許多領(lǐng)域都有望從中受益。在該論文中，研究者調(diào)查了以深度學(xué)習(xí)為支撐的現(xiàn)代計(jì)算機(jī)視覺技術(shù)在醫(yī)學(xué)領(lǐng)域的最新進(jìn)展，重點(diǎn)包括醫(yī)學(xué)成像、醫(yī)療視頻和臨床部署。

2021-03-20 10:02:25

6826

深度學(xué)習(xí)對(duì)機(jī)器視覺的好處與應(yīng)用領(lǐng)域

人工智能中的計(jì)算機(jī)視覺是人類視覺的自動(dòng)化。從零售、農(nóng)業(yè)、保險(xiǎn)到建筑，計(jì)算機(jī)視覺可以應(yīng)用于社會(huì)的許多領(lǐng)域。

2021-03-24 11:33:24

3395

淺談計(jì)算機(jī)視覺的無人車感知

數(shù)據(jù)集（5）路面與車道檢測(cè)數(shù)據(jù)集 3、計(jì)算機(jī)視覺能解決的問題：（1）物體的識(shí)別與跟蹤：識(shí)別（深度學(xué)習(xí)）：

2021-03-24 15:23:04

1572

計(jì)算機(jī)視覺的三大主流方向：圖像分割、目標(biāo)跟蹤與目標(biāo)檢測(cè)

雖然越來越多的伙伴想要從事計(jì)算機(jī)視覺領(lǐng)域的工作，但在入門學(xué)習(xí)時(shí)沒有專業(yè)的指導(dǎo)，直接將深度學(xué)習(xí)作為學(xué)習(xí)計(jì)算機(jī)視覺的切入點(diǎn)，導(dǎo)致只關(guān)注深度學(xué)習(xí)方法及相應(yīng)的開源代碼，而忽視了傳統(tǒng)方法的學(xué)習(xí)。

2021-03-29 11:15:17

4591

一片欣欣向榮背后，深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至

深度學(xué)習(xí)能夠?qū)崿F(xiàn)的前提是大量經(jīng)過標(biāo)注的數(shù)據(jù)，這使得計(jì)算機(jī)視覺領(lǐng)域的研究人員傾向于在數(shù)據(jù)資源豐富的領(lǐng)域搞研究，而不是去重要的領(lǐng)域搞研究。

2021-04-18 10:11:57

1567

剖析深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺之間的關(guān)系

某種程度上，深度學(xué)習(xí)最大的優(yōu)勢(shì)就是自動(dòng)創(chuàng)建沒有人會(huì)想到的特性能力。如今，深度學(xué)習(xí)在眾多領(lǐng)域都有一席之地，尤其是在計(jì)算機(jī)視覺領(lǐng)域。盡管許多人都為之深深著迷，然而，深網(wǎng)就相當(dāng)于一個(gè)黑盒子，我們大多數(shù)人

2021-04-22 10:45:45

2276

攻讀計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)碩士有啥好的？

人工智能就業(yè)市場持續(xù)火熱，越來越多的學(xué)子投身這一領(lǐng)域。然而，攻讀計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)研究生需要哪些先決條件？你將學(xué)到哪些知識(shí)？攻讀機(jī)器學(xué)習(xí)碩士是一種怎樣的體驗(yàn)？英國薩里大學(xué)機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺專業(yè)

2021-06-19 09:25:12

3153

計(jì)算機(jī)領(lǐng)域三巨頭聯(lián)手再發(fā)萬字長文

他們?cè)?b class="flag-6" style="color: red">計(jì)算機(jī)深度學(xué)習(xí)領(lǐng)域的貢獻(xiàn)。這也是圖靈獎(jiǎng)第三次同時(shí)頒給三位獲獎(jiǎng)?wù)摺?用于計(jì)算機(jī)深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)在上世紀(jì)80年代就已經(jīng)被提出

2021-07-05 10:07:55

1902

計(jì)算機(jī)視覺主要應(yīng)用領(lǐng)域有哪些

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在人工智能技術(shù)中，計(jì)算機(jī)視覺較早發(fā)展并取得突破，目前應(yīng)用場景也較為明確。計(jì)算機(jī)視覺在人工智能中占據(jù)重要市場地位，未來市場空間廣闊。

2022-03-31 10:02:33

14401

計(jì)算機(jī)視覺的重要性及如何幫助解決問題

　　機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺是一種基于人工智能的計(jì)算機(jī)視覺?；谌斯ぶ悄艿幕跈C(jī)器學(xué)習(xí)的計(jì)算機(jī)視覺具有人工神經(jīng)網(wǎng)絡(luò)或?qū)樱愃朴谌四X中的神經(jīng)網(wǎng)絡(luò)或?qū)?，用于連接和傳輸有關(guān)攝取的視覺數(shù)據(jù)的信號(hào)。在機(jī)器學(xué)習(xí)中，計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)具有獨(dú)立且不同的層，明確定義層之間的連接，以及視覺數(shù)據(jù)傳輸?shù)念A(yù)定義方向。

2022-04-06 16:49:42

3188

計(jì)算機(jī)視覺的概念、工作原理及行業(yè)用例

計(jì)算機(jī)視覺是一個(gè)研究領(lǐng)域，旨在助力計(jì)算機(jī)使用復(fù)雜算法（可以是傳統(tǒng)算法，也可以是基于深度學(xué)習(xí)的算法）來理解數(shù)字圖像和視頻并提取有用的信息。

2022-04-29 14:00:38

2134

計(jì)算機(jī)視覺為何重要？

2022-04-29 14:21:32

2886

計(jì)算機(jī)視覺的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用

本文將介紹計(jì)算機(jī)視覺的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用，對(duì)任何聽說過計(jì)算機(jī)視覺但不確定它是什么以及如何應(yīng)用的人，本文是了解計(jì)算機(jī)視覺這一復(fù)雜問題的便捷途徑。

2022-11-08 10:10:35

1098

深度學(xué)習(xí)和傳統(tǒng)計(jì)算機(jī)視覺技術(shù)在新興領(lǐng)域的比較

是不是深度學(xué)習(xí)就可以解決所有問題呢？是不是它就比傳統(tǒng)計(jì)算機(jī)視覺方法好呢？但是深度學(xué)習(xí)無法解決所有的問題，在一些問題上，具備全部特征的傳統(tǒng)技術(shù)仍是更好的方案。此外，深度學(xué)習(xí)可以和傳統(tǒng)算法結(jié)合，以克服深度學(xué)習(xí)帶來的計(jì)算力，時(shí)間，特點(diǎn)，輸入的質(zhì)量等方面的挑戰(zhàn)。

2022-11-28 11:01:15

1133

機(jī)器視覺和計(jì)算機(jī)視覺的區(qū)別

計(jì)算機(jī)視覺是一個(gè)研究領(lǐng)域，專注于使機(jī)器能夠解釋和分析來自周圍世界的視覺數(shù)據(jù)。簡單地說，它是機(jī)器像人類一樣看到和理解圖像和視頻的能力。

2023-02-22 09:34:54

770

淺析4個(gè)計(jì)算機(jī)視覺領(lǐng)域常用遷移學(xué)習(xí)模型

使用SOTA的預(yù)訓(xùn)練模型來通過遷移學(xué)習(xí)解決現(xiàn)實(shí)的計(jì)算機(jī)視覺問題。

2023-04-23 18:08:41

1023

理解如何處理計(jì)算機(jī)視覺和深度學(xué)習(xí)中的圖像數(shù)據(jù)

在過去幾年從事多個(gè)計(jì)算機(jī)視覺和深度學(xué)習(xí)項(xiàng)目之后，我在這個(gè)博客中收集了關(guān)于如何處理圖像數(shù)據(jù)的想法。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理基本上要比直接將其輸入深度學(xué)習(xí)模型更好。有時(shí)，甚至可能不需要深度學(xué)習(xí)模型，經(jīng)過一些處理后一個(gè)簡單的分類器可能就足夠了。

2023-04-26 11:57:12

458

計(jì)算機(jī)視覺應(yīng)用存在的3大瓶頸問題總結(jié)分析

目前智能制造工業(yè)檢測(cè)領(lǐng)域計(jì)算機(jī)視覺中的光照問題研究大多從算法上入手。如基于Retinex的X光非均勻鋼絲繩芯輸送帶圖像校正和增強(qiáng)算法提出了一種基于機(jī)器視覺的非均勻光照輸送帶圖像校正和故障檢測(cè)算法。

2023-05-31 09:55:40

1255

機(jī)器視覺和計(jì)算機(jī)視覺的區(qū)別

機(jī)器視覺和計(jì)算機(jī)視覺的區(qū)別機(jī)器視覺和計(jì)算機(jī)視覺是兩個(gè)相關(guān)但不同的概念。雖然許多人使用這兩個(gè)術(shù)語來描述同樣的事物，但它們?cè)谠S多方面仍然有所不同。這篇文章將詳細(xì)介紹機(jī)器視覺和計(jì)算機(jī)視覺的區(qū)別。機(jī)器

2023-08-09 16:51:04

970

計(jì)算機(jī)視覺中的九種深度學(xué)習(xí)技術(shù)

計(jì)算機(jī)視覺中仍有許多具有挑戰(zhàn)性的問題需要解決。然而，深度學(xué)習(xí)方法正在針對(duì)某些特定問題取得最新成果。在最基本的問題上，最有趣的不僅僅是深度學(xué)習(xí)模型的表現(xiàn);事實(shí)上，單個(gè)模型可以從圖像中學(xué)習(xí)意義并執(zhí)行視覺任務(wù)，從而無需使用專門的手工制作方法。

2023-08-21 09:56:05

306

反思深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺的關(guān)系

2023-09-12 08:29:46

373

用于計(jì)算機(jī)視覺的經(jīng)典機(jī)器學(xué)習(xí)應(yīng)用分析

深度學(xué)習(xí)是指在大部分未處理或“原始”數(shù)據(jù)上運(yùn)行的非常大的神經(jīng)網(wǎng)絡(luò)模型。深度學(xué)習(xí)通過將特征提取操作拉入模型本身，對(duì)計(jì)算機(jī)視覺產(chǎn)生了巨大影響，從而使算法根據(jù)需要學(xué)習(xí)信息量最大的特征。

2023-11-07 10:11:53

131

已全部加載完成

搜索歷史

淺談深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的三大瓶頸

評(píng)論