新时代RM游戏app,rm新时代爆单

先前呢，我們在最受歡迎的十大機(jī)器學(xué)習(xí)算法-part1和最受歡迎的十大機(jī)器學(xué)習(xí)算法-part2兩篇文章中簡單介紹了十種機(jī)器學(xué)習(xí)算法，有的讀者反映看完還是云里霧里，所以，我會(huì)挑幾種難理解的算法詳細(xì)講解一下，今天我們介紹的是線性判別分析。

線性判別分析(Linear Discriminant Analysis)簡稱LDA，是分類算法中的一種。LDA通過對(duì)歷史數(shù)據(jù)進(jìn)行投影，以保證投影后同一類別的數(shù)據(jù)盡量靠近，不同類別的數(shù)據(jù)盡量分開。并生成線性判別模型對(duì)新生成的數(shù)據(jù)進(jìn)行分離和預(yù)測。

LDA投影矩陣

在維基百科中對(duì)投影的定義是：“投影是從向量空間映射到自身的一種線性變換，是日常生活中“平行投影”概念的形式化和一般化”。例如，在日常生活中，陽光會(huì)在大地上留下各種物體的影子。陽光將三維空間中的物體映射到影子的二維空間中，而影子隨著一天中太陽照射角度的變化也會(huì)發(fā)生變化。

如果你玩過游戲《Shadowmatic》就能理解LDA投影的過程?！禨hadowmatic》是一款由TRIADA Studio開發(fā)的3D解謎游戲。游戲需要玩家在燈光下旋轉(zhuǎn)，扭動(dòng)懸浮在空中的不明物體，并通過燈光的投影在墻上尋找不明物體的真面目。只要找對(duì)角度就能成功。如下面的游戲截圖中，不明物體在某個(gè)角度的投影是一只可愛的小兔子。

LDA投影矩陣與《Shadowmatic》相似。其中的不明物體是歷史數(shù)據(jù)樣本。我們需要通過“旋轉(zhuǎn)”和“扭動(dòng)”這些歷史數(shù)據(jù)，找到正確的角度發(fā)現(xiàn)其中的模式。以下是銀行對(duì)企業(yè)貸款的樣本數(shù)據(jù)，其中包含了企業(yè)經(jīng)營時(shí)間和拖延還款天數(shù)以及最終是否還款的數(shù)據(jù)。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

我們把這些樣本數(shù)據(jù)生成散點(diǎn)圖，其中X軸是企業(yè)經(jīng)營時(shí)間，Y軸是拖延還款天數(shù)，藍(lán)色三角表示未還款數(shù)據(jù)，紅色方框表示已還款數(shù)據(jù)。在散點(diǎn)圖中未還款和已還款數(shù)據(jù)相互交織，無法發(fā)現(xiàn)其中的模式。這就是游戲中的不明物體。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

與游戲中不同的是我們無法“旋轉(zhuǎn)”和“扭動(dòng)”樣本數(shù)據(jù)，而是要通過移動(dòng)背景墻的位置來發(fā)現(xiàn)最終的“小兔子”。在下面的圖中，無論我們將樣本數(shù)據(jù)投影到X軸，還是Y軸，已還款和未還款的兩類數(shù)據(jù)都交織在一起，我們無法發(fā)現(xiàn)其中的模型。更無法對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測。因?yàn)槿魏我粋€(gè)單獨(dú)的維度都無法判斷企業(yè)最終是否會(huì)還款。我們需要變換投影背景墻的位置來找到能將兩類數(shù)據(jù)分離的“角度”。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

在LDA中這個(gè)投影背景墻是一個(gè)新的Y軸，角度是向量W。我們通過計(jì)算獲得向量W并生成新的Y軸，使兩個(gè)類別的樣本數(shù)據(jù)在新Y軸的投影中能最大程度的分離。計(jì)算向量W的方法是使用兩類數(shù)據(jù)的平均值差的平方除以兩類數(shù)據(jù)各自的方差之和。在這個(gè)公式中，我們希望分母越小越好，分子越大越好。換句話說就是兩類數(shù)據(jù)的均值相差的越大越好，這樣可以保證兩類數(shù)據(jù)間的分離程度。而同一類數(shù)據(jù)的方差越小越好，這樣可以保證每一類數(shù)據(jù)都不會(huì)太分散。這樣我們就可以找出一個(gè)W使J(W)的值最大。而這個(gè)最大值就是新的投影背景墻Y軸的方向。(這里需要通過拉格朗日來求W的最大值)

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

當(dāng)歷史樣本數(shù)據(jù)被投影到新的Y軸背景墻時(shí)，可以看到數(shù)據(jù)與之前的情況不同，被明顯的分為了兩組。并且兩組數(shù)據(jù)間的交叉很少。這符合了LDA的預(yù)期，不同類別的數(shù)據(jù)間分離的越遠(yuǎn)越好，同一類別的數(shù)據(jù)越集中越好。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

到這里我們對(duì)兩類數(shù)據(jù)進(jìn)行了分離，但這還不能實(shí)現(xiàn)對(duì)數(shù)據(jù)分類和預(yù)測。因此我們還需要找到一個(gè)點(diǎn)來區(qū)分這兩類數(shù)據(jù)。這個(gè)點(diǎn)就是線性辨別模型中。

LDA模式分類

線性辨別模型(Z=b1x1+b2x2)是一條直線方程，通過這條直線方程我們可以在散點(diǎn)圖中發(fā)現(xiàn)可以將兩組數(shù)據(jù)進(jìn)行區(qū)分的數(shù)據(jù)點(diǎn)。并對(duì)新產(chǎn)生的數(shù)據(jù)進(jìn)行分類和預(yù)測。如下圖所示，我們通過線性辨別模型獲得一條可以區(qū)分不同類別的直線。其中X1是企業(yè)經(jīng)營時(shí)間，X2是拖延還款天數(shù)。而b1和b2是我們所要求的模型系數(shù)。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

方差，協(xié)方差，協(xié)方差矩陣

在求線性辨別模型中的b1和b2時(shí)，需要用到協(xié)方差矩陣，因此我們先來簡單介紹與協(xié)方差有關(guān)的一些概念和計(jì)算方法。

均值

首先是均值，均值的計(jì)算很簡單。但要了解協(xié)方差和方差的概念，就必須先從均值開始。以下是均值的計(jì)算公式。均值表示一組數(shù)的集中程度。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

方差

方差與均值正好相反，用來表示一組數(shù)的離散程度，也就是一組數(shù)中每一個(gè)數(shù)到均值的距離。由于均值通常是一組數(shù)的中心點(diǎn)，為了避免左右兩側(cè)的數(shù)據(jù)由于正負(fù)相互抵消無法準(zhǔn)確的表示平均距離。我們先對(duì)距離取平方在進(jìn)行匯總，匯總的結(jié)果就是方差的值。方差開平方就是標(biāo)準(zhǔn)差。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

協(xié)方差

協(xié)方差是在方差的基礎(chǔ)上擴(kuò)展得到的，從計(jì)算公式中就能看出來。協(xié)方差與方差有兩個(gè)最大的區(qū)別，第一個(gè)區(qū)別是方差是用來描述一組數(shù)的而協(xié)方差是用來描述兩組數(shù)的。第二個(gè)區(qū)別是方差用來描述一組數(shù)的離散程度，也就是離均值的距離，而協(xié)方差是用來描述兩組數(shù)直接的聯(lián)系的。

方差與協(xié)方差計(jì)算公式：

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

協(xié)方差是一種用來度量兩個(gè)隨機(jī)變量關(guān)系的統(tǒng)計(jì)量。

當(dāng)cov(X, Y)>0時(shí)，表明 X與Y 正相關(guān);

當(dāng)cov(X, Y)<0時(shí)，表明X與Y負(fù)相關(guān);

當(dāng)cov(X, Y)=0時(shí)，表明X與Y不相關(guān)。

協(xié)方差矩陣

協(xié)方差只能處理兩組數(shù)(兩維)間的關(guān)系，當(dāng)要計(jì)算的數(shù)據(jù)多于兩組(多維)時(shí)，就要用到協(xié)方差矩陣。協(xié)方差矩陣其實(shí)是分別計(jì)算了不同維度之間的協(xié)方差。通過下圖可以發(fā)現(xiàn)協(xié)方差矩陣是一個(gè)對(duì)稱的矩陣，對(duì)角線是各個(gè)維度上的方差。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

計(jì)算線性辨別模型

在開始計(jì)算線性辨別模型之前，我們按企業(yè)是否還款將歷史數(shù)據(jù)分為已還款和未還款兩個(gè)類別。用以進(jìn)行后面的計(jì)算。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

計(jì)算均值，概覽及協(xié)方差矩陣

我們分別計(jì)算出已還款和未還款兩個(gè)類別中條目的數(shù)量，在整體樣本數(shù)據(jù)中出現(xiàn)的概率以及企業(yè)經(jīng)營時(shí)間和拖延還款天數(shù)的均值。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

按照前面介紹的協(xié)方差矩陣公式分別計(jì)算出兩個(gè)類別的協(xié)方差矩陣。從下圖中可以發(fā)現(xiàn)，協(xié)方差矩陣是一個(gè)對(duì)稱的矩陣，并且對(duì)角線上的兩個(gè)數(shù)字就是企業(yè)經(jīng)營天數(shù)和拖延還款天數(shù)的方差值。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

合并協(xié)方差矩陣

按照合并協(xié)方差的公式我們將兩個(gè)類別的協(xié)方差矩陣按出現(xiàn)的概率合并為一個(gè)協(xié)方差矩陣。以下是合并協(xié)方差的公式。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

按照上面的公式，將每個(gè)類別的協(xié)方差矩陣乘以該類別的概率我們獲得了合并協(xié)方差矩陣。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

逆協(xié)方差矩陣

最后我們對(duì)兩個(gè)類別的協(xié)方差矩陣求他的逆協(xié)方差矩陣。。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

這是我們求得的合并協(xié)方差矩陣的逆矩陣。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

計(jì)算線性辨別模型系數(shù)

求得逆協(xié)方差矩陣后，就可以通過兩個(gè)類別的均值差和逆協(xié)方差矩陣計(jì)算線性辨別模型的系數(shù)。下面分別給出了兩個(gè)類別的均值，逆協(xié)方差矩陣的對(duì)應(yīng)表。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

通過公式分別求出線性辨別模型的兩個(gè)系數(shù)b1和b2，以下是公式和計(jì)算步驟。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

b1=0.0001(116.23-115.04)+0.0003(16.89-55.32)=-0.009696

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

b2=0.0003(116.23-115.04)+0.0037(16.89-55.32)=-0.143453

兩個(gè)系數(shù)分別為b1=-0.009696，b2=-0.143453。將系數(shù)值代入到模型中，就是我們所求的線性辨別模型。

十大機(jī)器學(xué)習(xí)算法中的線性判別分析的詳細(xì)介紹

責(zé)任編輯：gt

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

3D

3D

+關(guān)注

關(guān)注
9

文章
2875

瀏覽量
107481
游戲

游戲

+關(guān)注

關(guān)注
2

文章
742

瀏覽量
26312
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8406

瀏覽量
132562

評(píng)論

相關(guān)推薦

【專輯精選】機(jī)器學(xué)習(xí)之算法教程與資料

電子發(fā)燒友總結(jié)了以“算法”為主題的精選干貨，今后每天一個(gè)主題為一期，希望對(duì)各位有所幫助！（點(diǎn)擊標(biāo)題即可進(jìn)入頁面下載相關(guān)資料）經(jīng)典算法大全（51個(gè)C語言算法+單片機(jī)常用算法+

發(fā)表于 05-09 17:06

基于核函數(shù)的Fisher判別分析算法在人耳識(shí)別中的應(yīng)用

針對(duì)人耳圖像自身的特點(diǎn)，并通過對(duì)現(xiàn)有生物識(shí)別技術(shù)的研究，本文嘗試采用了一種基于核函數(shù)的Fisher 判別分析算法對(duì)人耳進(jìn)行識(shí)別。該算法不僅可以有效地提取人耳特征，獲得

發(fā)表于 05-30 11:44 ?29次下載

近鄰邊界Fisher判別分析

將數(shù)據(jù)集進(jìn)行合理的維數(shù)約簡對(duì)于一些機(jī)器學(xué)習(xí)算法效率的提高起著至關(guān)重要的影響。該文提出了一種利用數(shù)據(jù)點(diǎn)鄰域信息的線性監(jiān)督降維算法：近鄰邊界Fi

發(fā)表于 11-21 11:12 ?7次下載

虛電壓的判別分析圖

虛電壓的判別分析圖

發(fā)表于 08-08 17:37 ?1634次閱讀

不相關(guān)判別分析算法在人臉識(shí)別中應(yīng)用

對(duì)高維數(shù)據(jù)降維并選取有效特征對(duì)分類起著關(guān)鍵作用。針對(duì)人臉識(shí)別中存在的高維和小樣本問題，從特征選取和子空間學(xué)習(xí)入手，提出了一種L2.1范數(shù)正則化的不相關(guān)判別分析算法。該

發(fā)表于 11-22 14:40 ?1次下載

核局部Fisher判別分析的行人重識(shí)別

；在度量學(xué)習(xí)方面，傳統(tǒng)的核局部Fisher判別分析度量學(xué)習(xí)方法對(duì)所有查詢圖像統(tǒng)一映射到相同的特征空間中，忽略了查詢圖像不同區(qū)域的重要性，為此在核局部Fisher判別分析的基礎(chǔ)上對(duì)特征進(jìn)

發(fā)表于 12-13 17:25 ?0次下載

基于逐步判別分析的血液氣味識(shí)別

本文以血液氣味色譜為基礎(chǔ)，利用逐步判別分析法建立了血液氣味識(shí)別模型，并對(duì)血液氣味識(shí)別模型的建立進(jìn)行了詳細(xì)描述。以Matlab為計(jì)算工具，編寫了血液氣味識(shí)別模型的代碼。以人體血液與犬、雞的血液為例，討論了血液氣味識(shí)別模型的使用方法。血液氣味識(shí)別模型能夠正確區(qū)分人體血液與動(dòng)物

發(fā)表于 01-04 16:38 ?0次下載

基于逐步<b class='flag-5'>判別分析</b>的血液氣味識(shí)別

機(jī)器學(xué)習(xí)算法中的FSS算法詳細(xì)資料合集免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)算法中的FSS算法

發(fā)表于 11-22 17:07 ?9次下載

python機(jī)器學(xué)習(xí)工具sklearn使用手冊的中文版免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是python機(jī)器學(xué)習(xí)工具sklearn使用手冊的中文版免費(fèi)下載包括了：1.緒言，2.有監(jiān)督學(xué)習(xí)，3.廣義

發(fā)表于 03-26 08:00 ?0次下載

利用基于線性判別分析的多變量分析模型對(duì)豇豆種子進(jìn)行分類

成像系統(tǒng)在高通量豇豆種子分類中的應(yīng)用潛力。利用自動(dòng)機(jī)器視覺發(fā)芽系統(tǒng)在種子吸脹和發(fā)芽期間不間斷地監(jiān)測，來識(shí)別所有單個(gè)種子的不同類別。本文利用從多光譜圖像中提取的單個(gè)豇豆種子的光譜特征，建立了基于線性

發(fā)表于 03-29 15:11 ?2438次閱讀

機(jī)器學(xué)習(xí)十大算法精髓總結(jié)

最常見的機(jī)器學(xué)習(xí)算法是學(xué)習(xí)映射Y = f(X)來預(yù)測新X的Y，這叫做預(yù)測建模或預(yù)測分析。

發(fā)表于 05-05 09:21 ?3771次閱讀

10大常用機(jī)器學(xué)習(xí)算法匯總

本文介紹了10大常用機(jī)器學(xué)習(xí)算法，包括線性回歸、Logistic回歸、線性

發(fā)表于 11-20 11:10 ?2785次閱讀

線性判別分析LDA背后的數(shù)學(xué)原理

線性判別分析（LDA）是一種降維技術(shù)，其目標(biāo)是將數(shù)據(jù)集投影到較低維度空間中。線性判別分析也被稱為正態(tài)判別分析（NDA）或

發(fā)表于 04-19 11:30 ?1383次閱讀

機(jī)器學(xué)習(xí)算法入門 機(jī)器學(xué)習(xí)算法介紹 機(jī)器學(xué)習(xí)算法對(duì)比

機(jī)器學(xué)習(xí)算法入門 機(jī)器學(xué)習(xí)算法介紹

發(fā)表于 08-17 16:27 ?947次閱讀

機(jī)器學(xué)習(xí)的基本流程和十大算法

為了進(jìn)行機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘任務(wù)，數(shù)據(jù)科學(xué)家們提出了各種模型，在眾多的數(shù)據(jù)挖掘模型中，國際權(quán)威的學(xué)術(shù)組織 ICDM（the IEEE International Conference on Data Mining）評(píng)選出了

發(fā)表于 10-31 11:30 ?1005次閱讀