RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)有效的機(jī)器學(xué)習(xí)你應(yīng)該知道這6個(gè)經(jīng)驗(yàn)教訓(xùn)

汽車玩家 ? 來(lái)源:電子創(chuàng)新網(wǎng) ? 作者:James Warner ? 2020-01-28 09:36 ? 次閱讀

機(jī)器人技術(shù)、智能家電、智能零售店、自動(dòng)駕駛汽車技術(shù)等的推動(dòng)下,我們正步入一個(gè)新時(shí)期。機(jī)器學(xué)習(xí)是所有這些新時(shí)代技術(shù)進(jìn)步的前沿。在不久的將來(lái),自動(dòng)化機(jī)器的發(fā)展將使得機(jī)器與人類智能相當(dāng)甚至超過(guò)人類智能。機(jī)器學(xué)習(xí)無(wú)疑是下一個(gè)“大”事件。而且,人們相信,未來(lái)的大多數(shù)技術(shù)都將與之掛鉤。

為什么機(jī)器學(xué)習(xí)這么重要?

機(jī)器學(xué)習(xí)非常重要,因?yàn)樗兄陬A(yù)測(cè)人類無(wú)法預(yù)測(cè)的行為和模式。機(jī)器學(xué)習(xí)有無(wú)數(shù)非常有用的實(shí)際應(yīng)用。通過(guò)機(jī)器學(xué)習(xí),有可能管理以前令人困惑的場(chǎng)景。在理解了具有高效泛化能力的機(jī)器學(xué)習(xí)模型之后,可以使用它做出相應(yīng)的重要決策。機(jī)器學(xué)習(xí)使個(gè)人能夠根據(jù)大量場(chǎng)景做出決策。顯然,現(xiàn)在還不能編寫出能夠用于所有新場(chǎng)景的代碼。

人工智能能夠執(zhí)行各種需要學(xué)習(xí)和判斷的活動(dòng)。從自動(dòng)駕駛汽車、投資銀行、許多醫(yī)療相關(guān)功能到招聘,人工智能已經(jīng)被用于完成不同領(lǐng)域的各種任務(wù)。

6 個(gè)關(guān)于機(jī)器學(xué)習(xí)的革命性教訓(xùn)

機(jī)器學(xué)習(xí)算法能夠簡(jiǎn)單地從場(chǎng)景中泛化,得到執(zhí)行必要任務(wù)的方法。這樣更切實(shí)可行和而且具有成本效益,然而,手工編程并不那么具有成本效益和可行性?!翱捎脭?shù)據(jù)”數(shù)量的增加肯定會(huì)導(dǎo)致出現(xiàn)更多的與獲取數(shù)據(jù)相關(guān)的問題。因此,機(jī)器學(xué)習(xí)是未來(lái),因?yàn)樗鼘V泛應(yīng)用于計(jì)算機(jī)和其他領(lǐng)域。盡管如此,開發(fā)有效的機(jī)器學(xué)習(xí)應(yīng)用需要大量的“黑魔法”,這在手冊(cè)中很難找到。

以下是關(guān)于機(jī)器學(xué)習(xí)最有價(jià)值的 6 個(gè)經(jīng)驗(yàn)教訓(xùn):

1. 泛化是核心

機(jī)器學(xué)習(xí)最基本的特征之一是,算法必須從訓(xùn)練的數(shù)據(jù)中泛化出該領(lǐng)域中所有不可見場(chǎng)景的完整領(lǐng)域,以便在使用模型時(shí)能夠做出正確的推斷。這個(gè)泛化的過(guò)程需要我們用來(lái)訓(xùn)練模型的數(shù)據(jù)有一個(gè)我們希望算法去學(xué)習(xí)的,像樣的和可靠的映射。數(shù)據(jù)的質(zhì)量越好,表達(dá)能力越高,模型就越容易理解從輸入到輸出的未知的和基本的“真實(shí)”映射。泛化是指從某種精確的東西轉(zhuǎn)向某種廣泛的東西。

機(jī)器學(xué)習(xí)算法是從歷史場(chǎng)景中自動(dòng)簡(jiǎn)化的技術(shù)。它們有能力在更大的數(shù)據(jù)量和更快的速度上進(jìn)行泛化。

所有機(jī)器學(xué)習(xí)初學(xué)者最常犯的錯(cuò)誤就是對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行測(cè)試,然后看起來(lái)像是成功了。如果在新數(shù)據(jù)上嘗試所得到分類器,它通常不會(huì)比隨機(jī)猜測(cè)更好。所以,如果你想要開發(fā)一個(gè)分類器,一定要留一些數(shù)據(jù)做測(cè)試。同時(shí),用你的分類器對(duì)測(cè)試數(shù)據(jù)進(jìn)行測(cè)試。

2. 學(xué)習(xí)=表示+評(píng)估+優(yōu)化

機(jī)器學(xué)習(xí)算法分為 3 個(gè)部分,表示、評(píng)估和優(yōu)化

表示:數(shù)據(jù)需要以合適的算法形式輸入。對(duì)于文本分類,可以從全文輸入中提取特征,并將其變?yōu)?bag-of-words 的表示形式。相反,選擇一種表示方法與選擇它可能學(xué)習(xí)的分類器集是同義詞。這個(gè)集合稱為學(xué)習(xí)者的假設(shè)空間。

評(píng)估:這是一個(gè)幫助我們理解我們正在做什么的度量。需要一個(gè)評(píng)估過(guò)程來(lái)區(qū)分好分類器和不好的分類器。如果你可以給測(cè)試集預(yù)測(cè)出一個(gè)數(shù)字,例如測(cè)試集的大小為 n,在這里,你可以計(jì)算平均絕對(duì)誤差,甚至可以選擇使用均方根誤差。

優(yōu)化:它是指尋找方法來(lái)選擇不同的技術(shù)來(lái)優(yōu)化它的過(guò)程。例如,我們可以簡(jiǎn)單地嘗試假設(shè)空間中的每一個(gè)假設(shè)。我們也可能選擇使用更智能的技術(shù)來(lái)嘗試最有利的假設(shè)。同時(shí),當(dāng)我們進(jìn)行優(yōu)化時(shí),我們可以利用評(píng)價(jià)函數(shù)來(lái)了解這個(gè)特定的假設(shè)是否成立。如果評(píng)價(jià)函數(shù)有多個(gè)最優(yōu)值,則優(yōu)化技術(shù)允許用戶了解更多關(guān)于所創(chuàng)建分類器的信息。首先,初學(xué)者應(yīng)該從現(xiàn)成的優(yōu)化器開始,然后再轉(zhuǎn)向定制設(shè)計(jì)的優(yōu)化器。

3. 只有數(shù)據(jù)是不夠的!

泛化是主要目的,但主要關(guān)注的是,無(wú)論數(shù)量多少,僅有數(shù)據(jù)是不夠的。但是,幸運(yùn)的是,我們想掌握的功能并不是從所有可計(jì)算的功能中統(tǒng)一得出的!即使是最一般的假設(shè)(包括平滑度,具有類似類的相似示樣本,不充分的依存關(guān)系或受限制的復(fù)雜度)也足以正常運(yùn)行,這是使機(jī)器學(xué)習(xí)如此強(qiáng)大的主要原因之一?;旧?,所有初學(xué)者都聯(lián)合了解大數(shù)據(jù)來(lái)制作應(yīng)用程序。

4. 小心過(guò)擬合

如果數(shù)據(jù)不充分,不能完全訓(xùn)練好一個(gè)分類器,我們可能最終得到的是只在訓(xùn)練集上有用的分類器。這個(gè)問題被稱為 overfitting,它被認(rèn)為是 ML 的一個(gè)麻煩事。發(fā)現(xiàn)自己的模型過(guò)擬合了是有用的,但并不能解決這個(gè)問題。你得想辦法擺脫它。幸運(yùn)的是,你有很多選擇去嘗試。交叉驗(yàn)證有助于防止過(guò)擬合。訓(xùn)練更多的數(shù)據(jù),正則化,刪除特征,早期停止,集成是一些其他的防止過(guò)擬合的方法。

5. 特征工程是成功的關(guān)鍵

特征工程是利用數(shù)據(jù)的核心領(lǐng)域知識(shí)來(lái)開發(fā)使機(jī)器學(xué)習(xí)算法更好工作的特征的技術(shù)。如果處理得當(dāng),它可以通過(guò)從原始數(shù)據(jù)中開發(fā)特征來(lái)增強(qiáng)算法的預(yù)測(cè)能力。這些特征簡(jiǎn)化了整個(gè)機(jī)器學(xué)習(xí)過(guò)程。利用幾個(gè)獨(dú)立的特征,很好地與類相關(guān),然后讓學(xué)習(xí)變得容易。

6. 準(zhǔn)確性&簡(jiǎn)單性是不一樣的

奧卡姆剃刀(Occam’s razor)精辟地指出,實(shí)體的增加不應(yīng)超出要求。這意味著兩個(gè)分類器有相似的訓(xùn)練誤差,兩個(gè)分類器中較簡(jiǎn)單的可能有最低的測(cè)試誤差。每一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目都應(yīng)該以你希望回答的業(yè)務(wù)問題為目標(biāo)。你應(yīng)該從制定分析的主要成功原則開始。

應(yīng)用 Occam’s razor 并選擇最容易解釋、闡明、部署和管理的模型是構(gòu)建強(qiáng)大的機(jī)器學(xué)習(xí)程序的關(guān)鍵步驟。建議選擇最簡(jiǎn)單的、足夠精確的模型,但是,要確保你深入了解這個(gè)問題,以了解“足夠精確”在實(shí)踐中意味著什么。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28379

    瀏覽量

    206913
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238245
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8406

    瀏覽量

    132560
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    工程師13年編碼、測(cè)試和調(diào)試經(jīng)驗(yàn)大匯總

    最近,我回顧了我所有的194個(gè)條目(從13歲開始),看看有什么經(jīng)驗(yàn)教訓(xùn)是我可以學(xué)習(xí)的。下面是我總結(jié)的最重要的經(jīng)驗(yàn)教訓(xùn),包括編碼,測(cè)試和調(diào)試三個(gè)
    發(fā)表于 07-17 22:41 ?2021次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.33】做了50年軟件開發(fā),總結(jié)出60條經(jīng)驗(yàn)教訓(xùn),每一條都太扎心!

    的60 條經(jīng)驗(yàn)教訓(xùn) ,分為 6 個(gè)領(lǐng)域,每個(gè)領(lǐng)域占用 1 章的篇幅。 所有的 60 條經(jīng)驗(yàn)教訓(xùn)都會(huì)收錄在附錄中,以便大家參考。 我并沒
    發(fā)表于 05-17 14:36

    生物識(shí)別可穿戴產(chǎn)品開發(fā)有什么經(jīng)驗(yàn)教訓(xùn)

    設(shè)想一下,您正在參加一個(gè)計(jì)劃會(huì)議。團(tuán)隊(duì)剛剛提出了一些非常棒的想法,他們?yōu)樾碌目纱┐髟O(shè)備設(shè)計(jì)了一種光學(xué)心率傳感器,您可以將其添加到您的產(chǎn)品線中。他們都向您求助:我們應(yīng)該與誰(shuí)合作開發(fā)傳感器系統(tǒng)? 突然間您意識(shí)到你并不完全確定從哪里著
    發(fā)表于 08-06 07:27

    求大神分享單片機(jī)從業(yè)的經(jīng)驗(yàn)教訓(xùn)學(xué)習(xí)歷程?

    求大神分享單片機(jī)從業(yè)的經(jīng)驗(yàn)教訓(xùn)學(xué)習(xí)歷程?
    發(fā)表于 09-18 09:16

    珠海炬力與SigmaTel達(dá)成和解的經(jīng)驗(yàn)教訓(xùn)

    珠海炬力與SigmaTel達(dá)成和解的經(jīng)驗(yàn)教訓(xùn):珠海炬力是我國(guó)一家領(lǐng)先的集成電路設(shè)計(jì)公司,成立以來(lái)堅(jiān)持以市場(chǎng)為導(dǎo)向,堅(jiān)持自主創(chuàng)新。因此在公司發(fā)展,市場(chǎng)開拓等等方面成績(jī)斐然,
    發(fā)表于 12-24 10:58 ?4次下載

    借鑒開發(fā)人員累計(jì)的經(jīng)驗(yàn)教訓(xùn)構(gòu)建更出色的嵌入式系統(tǒng)

    隨著嵌入式系統(tǒng)不斷普及,我們可以從積累的開發(fā)知識(shí)中獲得巨大優(yōu)勢(shì),構(gòu)建更出色的系統(tǒng)。 工程師一刻也沒忘記交付能同時(shí)滿足質(zhì)量、時(shí)間安排和預(yù)算目標(biāo)的項(xiàng)目的需求。一個(gè)事半功倍的方法 就是借鑒嵌入式系統(tǒng)開發(fā)人員社區(qū)多年來(lái)累計(jì)的
    發(fā)表于 11-16 20:44 ?1118次閱讀
    借鑒<b class='flag-5'>開發(fā)</b>人員累計(jì)的<b class='flag-5'>經(jīng)驗(yàn)教訓(xùn)</b>構(gòu)建更出色的嵌入式系統(tǒng)

    工程師跨度13年、回顧194個(gè)bug總結(jié)的18條編碼、測(cè)試和調(diào)試經(jīng)驗(yàn)教訓(xùn)

    工程師跨度13年、回顧194個(gè)bug總結(jié)的18條編碼、測(cè)試和調(diào)試經(jīng)驗(yàn)教訓(xùn)
    發(fā)表于 02-27 16:50 ?1074次閱讀

    google機(jī)器學(xué)習(xí)團(tuán)隊(duì)開發(fā)機(jī)器學(xué)習(xí)系統(tǒng)Seti的一些經(jīng)驗(yàn)教訓(xùn)

    system》的博客,作者應(yīng)該是google機(jī)器學(xué)習(xí)團(tuán)隊(duì)的成員,列舉了他們?cè)?b class='flag-5'>開發(fā)個(gè)可伸縮的大型機(jī)器
    發(fā)表于 06-01 09:25 ?1674次閱讀

    企業(yè)如何從智能家居中吸取經(jīng)驗(yàn)教訓(xùn)

    這是一個(gè)機(jī)會(huì)眾多的領(lǐng)域,越來(lái)越多的設(shè)備制造商正在嘗試?yán)眠@一領(lǐng)域,并且具有無(wú)限可能性——尤其是那些能夠從智能家居中吸取經(jīng)驗(yàn)教訓(xùn)的企業(yè)。
    的頭像 發(fā)表于 11-19 14:17 ?2831次閱讀

    Pedro Domingos教授的研究論文匯集機(jī)器學(xué)習(xí)研究人員的經(jīng)驗(yàn)教訓(xùn)

    機(jī)器學(xué)習(xí)算法被認(rèn)為能夠通過(guò)學(xué)習(xí)數(shù)據(jù)來(lái)弄清楚如何執(zhí)行重要任務(wù)。意味著數(shù)據(jù)量越大,這些算法就可以解決更加復(fù)雜的問題。然而,開發(fā)成功的
    的頭像 發(fā)表于 05-17 11:35 ?1935次閱讀

    AI和機(jī)器學(xué)習(xí)歷程經(jīng)驗(yàn)教訓(xùn)總結(jié)

    我最近有幸與幾位AI /機(jī)器學(xué)習(xí)專家一起參加了小組討論。 有很多偉大的問題,但大多數(shù)與如何在大型組織中最有效地建立AI /機(jī)器學(xué)習(xí)(AI /
    的頭像 發(fā)表于 05-03 18:06 ?2298次閱讀

    寫在最前:?jiǎn)纹瑱C(jī)從業(yè)的經(jīng)驗(yàn)教訓(xùn)和歷程。

    單片機(jī)從業(yè)的經(jīng)驗(yàn)教訓(xùn)和歷程寫在開始為什么寫這些怎么學(xué)習(xí)的有什么教訓(xùn)經(jīng)驗(yàn)**1如果的學(xué)校還在用匯編教學(xué)單片機(jī),那么請(qǐng)放棄教學(xué)課程混
    發(fā)表于 11-15 13:36 ?7次下載
    寫在最前:?jiǎn)纹瑱C(jī)從業(yè)的<b class='flag-5'>經(jīng)驗(yàn)教訓(xùn)</b>和歷程。

    NASA的經(jīng)驗(yàn)教訓(xùn)文件中的一些電氣工程事故

    在航天器完成之前,美國(guó)宇航局的經(jīng)驗(yàn)教訓(xùn)檔案中的一個(gè)條目詳細(xì)介紹了一名工程師在下班后在沒有適當(dāng)測(cè)試協(xié)議的情況下對(duì)麥哲倫動(dòng)力控制單元進(jìn)行測(cè)試。如果沒有質(zhì)量保證概述或測(cè)試程序,就會(huì)出現(xiàn)錯(cuò)誤并在設(shè)備上施加反向電壓。
    的頭像 發(fā)表于 10-20 14:29 ?892次閱讀

    從50多個(gè)生物識(shí)別可穿戴產(chǎn)品開發(fā)周期得到的十大經(jīng)驗(yàn)教訓(xùn)

    從50多個(gè)生物識(shí)別可穿戴產(chǎn)品開發(fā)周期得到的十大經(jīng)驗(yàn)教訓(xùn)
    發(fā)表于 11-01 08:26 ?0次下載
    從50多個(gè)生物識(shí)別可穿戴產(chǎn)品<b class='flag-5'>開發(fā)</b>周期得到的十大<b class='flag-5'>經(jīng)驗(yàn)教訓(xùn)</b>

    嵌入式微控制器應(yīng)用中的無(wú)線(OTA)更新:設(shè)計(jì)權(quán)衡與經(jīng)驗(yàn)教訓(xùn)

    電子發(fā)燒友網(wǎng)站提供《嵌入式微控制器應(yīng)用中的無(wú)線(OTA)更新:設(shè)計(jì)權(quán)衡與經(jīng)驗(yàn)教訓(xùn).pdf》資料免費(fèi)下載
    發(fā)表于 11-23 16:01 ?0次下載
    嵌入式微控制器應(yīng)用中的無(wú)線(OTA)更新:設(shè)計(jì)權(quán)衡與<b class='flag-5'>經(jīng)驗(yàn)教訓(xùn)</b>
    RM新时代网站-首页