關(guān)于TD Learning算法的分析

導(dǎo)讀：?人工智能之機(jī)器學(xué)習(xí)主要有三大類：1）分類；2）回歸；3）聚類。今天我們重點(diǎn)探討一下TD Learning算法。

TD Learning時(shí)序差分學(xué)習(xí)結(jié)合了動(dòng)態(tài)規(guī)劃DP和蒙特卡洛MC方法，且兼具兩種算法的優(yōu)點(diǎn)，是強(qiáng)化學(xué)習(xí)的核心思想。

雖然蒙特卡羅MC方法僅在最終結(jié)果已知時(shí)才調(diào)整其估計(jì)值，但TD Learning時(shí)序差分學(xué)習(xí)調(diào)整預(yù)測以匹配后，更準(zhǔn)確地預(yù)測最終結(jié)果之前的未來預(yù)測。

TD Learning算法概念：

TD Learning（Temporal－Difference Learning） 時(shí)序差分學(xué)習(xí)指的是一類無模型的強(qiáng)化學(xué)習(xí)方法，它是從當(dāng)前價(jià)值函數(shù)估計(jì)的自舉過程中學(xué)習(xí)的。這些方法從環(huán)境中取樣，如蒙特卡洛方法，并基于當(dāng)前估計(jì)執(zhí)行更新，如動(dòng)態(tài)規(guī)劃方法。

TD Learning算法本質(zhì)：

TD Learning（Temporal－DifferenceLearning）時(shí)序差分學(xué)習(xí)結(jié)合了動(dòng)態(tài)規(guī)劃和蒙特卡洛方法，是強(qiáng)化學(xué)習(xí)的核心思想。

時(shí)序差分不好理解。改為當(dāng)時(shí)差分學(xué)習(xí)比較形象一些，表示通過當(dāng)前的差分?jǐn)?shù)據(jù)來學(xué)習(xí)。

蒙特卡洛MC方法是模擬（或者經(jīng)歷）一段序列或情節(jié)，在序列或情節(jié)結(jié)束后，根據(jù)序列或情節(jié)上各個(gè)狀態(tài)的價(jià)值，來估計(jì)狀態(tài)價(jià)值。TD Learning時(shí)序差分學(xué)習(xí)是模擬（或者經(jīng)歷）一段序列或情節(jié)，每行動(dòng)一步（或者幾步），根據(jù)新狀態(tài)的價(jià)值，然后估計(jì)執(zhí)行前的狀態(tài)價(jià)值。可以認(rèn)為蒙特卡洛MC方法是最大步數(shù)的TD Learning時(shí)序差分學(xué)習(xí)。

TD Learning算法描述：

如果可以計(jì)算出策略價(jià)值（π狀態(tài)價(jià)值vπ（s），或者行動(dòng)價(jià)值qπ（s，a）），就可以優(yōu)化策略。

在蒙特卡洛方法中，計(jì)算策略的價(jià)值，需要完成一個(gè)情節(jié)，通過情節(jié)的目標(biāo)價(jià)值Gt來計(jì)算狀態(tài)的價(jià)值。其公式：

MC公式：

V（St）←V（St）＋αδt

δt＝［Gt？V（St）］

這里：

δt – MC誤差

α – MC學(xué)習(xí)步長

TD Learning公式：

V（St）←V（St）＋αδt

δt＝［Rt＋1＋γV（St＋1）？V（St）］

這里：

δt – TD Learning誤差

α – TD Learning步長

γ – TD Learning報(bào)酬貼現(xiàn)率

TD Learning時(shí)間差分方法的目標(biāo)為Rt＋1＋γ V（St＋1），若V（St＋1）采用真實(shí)值，則TD Learning時(shí)間差分方法估計(jì)也是無偏估計(jì)，然而在試驗(yàn)中V（St＋1） ?用的也是估計(jì)值，因此TD Learning時(shí)間差分方法屬于有偏估計(jì)。然而，跟蒙特卡羅MC方法相比，TD Learning時(shí)間差分方法只用到了一步隨機(jī)狀態(tài)和動(dòng)作，因此TD Learning時(shí)間差分方法目標(biāo)的隨機(jī)性比蒙特卡羅MC方法中的Gt 要小，因此其方差也比蒙特卡羅MC方法的方差小。

TD Learning分類：

1）策略狀態(tài)價(jià)值vπ的時(shí)序差分學(xué)習(xí)方法（單步多步）

2）策略行動(dòng)價(jià)值qπ的on－policy時(shí)序差分學(xué)習(xí)方法： Sarsa（單步多步）

3）策略行動(dòng)價(jià)值qπ的off－policy時(shí)序差分學(xué)習(xí)方法： Q－learning（單步），Double Q－learning（單步）

4）策略行動(dòng)價(jià)值qπ的off－policy時(shí)序差分學(xué)習(xí)方法（帶importance sampling）： Sarsa（多步）

5）策略行動(dòng)價(jià)值qπ的off－policy時(shí)序差分學(xué)習(xí)方法（不帶importance sampling）： Tree Backup Algorithm（多步）

6）策略行動(dòng)價(jià)值qπ的off－policy時(shí)序差分學(xué)習(xí)方法： Q（σ）（多步）

TD Learning算法流程：

1）單步TD Learning時(shí)序差分學(xué)習(xí)方法：

InitializeV（s） arbitrarily ？s∈S＋

Repeat（for each episode）：

？Initialize S

？Repeat （for each step of episode）：

？？ A←actiongiven by π for S

？？Take action A， observe R，S′

？？V（S）←V（S）＋α［R＋γV（S′）？V（S）］

？？ S←S′

？Until S is terminal

2）多步TD Learning時(shí)序差分學(xué)習(xí)方法：

Input：the policy π to be evaluated

InitializeV（s） arbitrarily ？s∈S

Parameters：step size α∈（0，1］， a positive integer n

Allstore and access operations （for St and Rt） can take their index mod n

Repeat（for each episode）：

？Initialize and store S0≠terminal

？ T←∞

？ Fort＝0，1，2，？：

？？ Ift＜Tt＜T， then：

？？？Take an action according to π（ ˙｜St）

？？？Observe and store the next reward as Rt＋1 and the next state as St＋1

？？？If St＋1 is terminal， then T←t＋1

？？ τ←t？n＋1（τ is the time whose state＇s estimate is being updated）

？？ Ifτ≥0τ≥0：

？？？ G←∑min（τ＋n，T）i＝τ＋1γi？τ？1Ri

？？？if τ＋n≤Tτ＋n≤T then： G←G＋γnV（Sτ＋n）（G（n）τ）

？？？V（Sτ）←V（Sτ）＋α［G？V（Sτ）］

？Until τ＝T？1

注意：V（S0）是由V（S0），V（S1），…，V（Sn）計(jì)算所得；V（S1）是由V（S1），V（S1），…，V（Sn＋1）計(jì)算所得。

TD Learning理論基礎(chǔ)

TD Learning理論基礎(chǔ)如下：

1）蒙特卡羅方法

2）動(dòng)態(tài)規(guī)劃

3）信號(hào)系統(tǒng)

TD Learning算法優(yōu)點(diǎn)：

1）不需要環(huán)境的模型；

2）可以采用在線的、完全增量式的實(shí)現(xiàn)方式；

3）不需等到最終的真實(shí)結(jié)果；

4）不局限于episode task；

5）可以用于連續(xù)任務(wù)；

6）可以保證收斂到 vπ，收斂速度較快。

TD Learning算法缺點(diǎn)：

1） ? ?對(duì)初始值比較敏感；

2） ? ?并非總是用函數(shù)逼近。

TD Learning算法應(yīng)用：

從應(yīng)用角度看，TD Learning應(yīng)用領(lǐng)域與應(yīng)用前景都是非常廣闊的，目前主要應(yīng)用于動(dòng)態(tài)系統(tǒng)、機(jī)器人控制及其他需要進(jìn)行系統(tǒng)控制的領(lǐng)域。

結(jié)語：

TD Learning是結(jié)合了動(dòng)態(tài)規(guī)劃DP和蒙特卡洛MC方法，并兼具兩種算法的優(yōu)點(diǎn)，是強(qiáng)化學(xué)習(xí)的中心。TD Learning不需要環(huán)境的動(dòng)態(tài)模型，直接從經(jīng)驗(yàn)經(jīng)歷中學(xué)習(xí)；也不需要等到最終的結(jié)果才更新模型，它可以基于其他估計(jì)值來更新估計(jì)值。輸入數(shù)據(jù)可以刺激模型并且使模型做出反應(yīng)。反饋不僅從監(jiān)督學(xué)習(xí)的學(xué)習(xí)過程中得到，還從環(huán)境中的獎(jiǎng)勵(lì)或懲罰中得到。TD Learning算法已經(jīng)被廣泛應(yīng)用于動(dòng)態(tài)系統(tǒng)、機(jī)器人控制及其他需要進(jìn)行系統(tǒng)控制的領(lǐng)域。

閱讀全文

算法(90512) 算法(90512)
人工智能(229987) 人工智能(229987)

評(píng)論

相關(guān)推薦

TD-LTE天線部署場景分析

2013年以來，全球TD-LTE網(wǎng)絡(luò)進(jìn)入蓬勃發(fā)展期。最新統(tǒng)計(jì)數(shù)據(jù)表明，截至2013年5月，全球已商用17個(gè)TD-LTE網(wǎng)絡(luò)，另有40余家運(yùn)營商公布了明確的TD-LTE商用計(jì)劃，全球TD-LTE用戶數(shù)突破300萬。

2013-06-26 13:51:57

2138

LEARNING_ROBOTICS_USING_PYTHON

LEARNING_ROBOTICS_USING_PYTHON

2016-09-28 11:44:25

Learning ROS for Robotics Programming - Second Edition

Learning ROS for Robotics Programming - Second Edition

2016-09-28 11:45:38

TD-LTE/GSM共站建設(shè)方案可行性論證和分析

，TD-SCDMA站點(diǎn)資源不足的問題，顯得尤為突出。本文介紹了愛立信近期提出的TD-LTE/GSM共站建設(shè)方案，并對(duì)其可行性進(jìn)行了論證和分析。主要通過系統(tǒng)仿真分析了系統(tǒng)覆蓋和容量，并對(duì)共享雙頻天線方案提出了建議

2019-07-15 06:30:47

TD-SCDMA基站覆蓋和容量能力分析

TD-SCDMA基站覆蓋和容量能力分析     2006年1月20日，TD-SCDMA正式成為中國3G行業(yè)標(biāo)準(zhǔn)。作為中國具有自主知識(shí)產(chǎn)權(quán)的3G

2009-11-13 22:23:44

TD-SCDMA無線網(wǎng)絡(luò)優(yōu)化案例分析

TD-SCDMA無線網(wǎng)絡(luò)優(yōu)化案例分析本章目標(biāo):1：熟悉TD-SCDMA弱覆蓋引起掉話情況2：掌握TD-SCDMA乒乓切換引起掉話情況3：熟悉TD-SCDMA信號(hào)波動(dòng)引起掉話情況4：掌握

2009-05-22 14:19:06

TD-SCDMA系統(tǒng)外環(huán)功控分析

TD-SCDMA系統(tǒng)外環(huán)功控分析1 引言人們對(duì)通信日益增長的需求促進(jìn)了通信技術(shù)的發(fā)展。為了提高通信系統(tǒng)的質(zhì)量和容量，種種先進(jìn)的通信技術(shù)得到了深入研究和發(fā)展。其中，最為突出的就是對(duì)CDMA技術(shù)的研究

2009-11-13 22:15:08

TD-SCDMA問題 ,kpi指標(biāo)分析

TD-SCDMA問題 ,kpi指標(biāo)分析本章目標(biāo):1：了解TD-SCDMA KPI指標(biāo)獲取方法2：熟悉TD-SCDMA系統(tǒng)中典型的KPI指標(biāo)3：掌握TD-SCDMA系統(tǒng)中某些重要KPI指標(biāo)含義4：熟悉

2009-05-22 14:50:58

關(guān)于TD-SCDMA射頻測試內(nèi)容，總結(jié)的太棒了

關(guān)于TD-SCDMA射頻測試內(nèi)容，總結(jié)的太棒了

2021-05-08 08:50:01

關(guān)于TD2030問題，我一通電，TD2030就發(fā)熱，而且很燙，怎么..

本帖最后由 gk320830 于 2015-3-5 13:14 編輯 關(guān)于TD2030問題，我一通電，TD2030就發(fā)熱，而且很燙，要怎么辦？沒有音頻輸入，電位器調(diào)了也沒用

2014-04-26 21:15:06

關(guān)于ADPCM壓縮算法流程介紹

關(guān)于ADPCM壓縮算法流程介紹

2021-06-03 06:44:13

關(guān)于電機(jī)加速時(shí)間及距離的算法看完你就懂了

關(guān)于電機(jī)加速時(shí)間及距離的算法看完你就懂了

2021-10-09 09:05:03

CCD圖像分析方法和預(yù)測算法？？？

2012-07-01 15:20:49

DFT算法與FFT算法的優(yōu)劣分析

本文參考銀河電氣官網(wǎng)：DFT算法與FFT算法的優(yōu)劣分析DFT與它的快速算法FFT相比可能更有優(yōu)勢,而FFT卻存在某些局限性.在只需要求出部分頻點(diǎn)的頻率譜線時(shí)DFT的運(yùn)算時(shí)間大為減少,所需的數(shù)據(jù)內(nèi)存

2014-05-22 20:43:36

Ensemble Learning Task

學(xué)習(xí)地址：https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearningTask

2021-07-07 07:06:38

FDTD算法分析

周末好，今天接著聊麥克斯韋方程組，高頻電信號(hào)，光信號(hào)，都用到了FDTD算法進(jìn)行仿真，這是個(gè)什么東東這么霸氣。前情是，光是電磁波，電也是電磁波，那很多東西，國華就把他們放一起分析。

2019-07-02 06:09:45

MCU也能做Machine learning嗎

你知道嗎？MCU也能做Machine learning (ML)剛剛過去的2018年被稱為“人工智能元年”，2隨著單芯片計(jì)算力的不斷增長，機(jī)器學(xué)習(xí)（ML）不再是云計(jì)算和高性能處理器的專利，邊緣計(jì)算

2021-11-03 06:36:32

Matlab關(guān)于FFT算法的編程及原理詳細(xì)講解

附件1是關(guān)于直接運(yùn)行FFT工具箱進(jìn)行頻譜分析，請(qǐng)大家可以參考對(duì)照，對(duì)理解FFT算法肯定有幫助！希望對(duì)大家有幫助！附件2是關(guān)于FFT算法的詳細(xì)編程，及詳細(xì)原理講解，個(gè)人認(rèn)為，這篇論文對(duì)從事信號(hào)處理，頻譜分析很有幫助，特使是進(jìn)一步理解FFT算法，很有必要閱讀。程序+原理+運(yùn)行!

2010-11-14 11:25:43

NVIDIA火熱招聘深度學(xué)習(xí) (Deep Learning) 達(dá)人

崗位:1. Deep Learning Solution Architect - Beijing/Shanghai/Shenzhen2. Deep Learning Performance

2017-08-25 17:04:24

Neural network and deep learning閱讀筆記梯度消失怎么辦

Neural network and deep learning閱讀筆記（5）梯度消失問題

2020-05-29 12:29:51

TI電機(jī)模塊算法資料大全（39個(gè)算法分析）

本文詳細(xì)的介紹了TI的電機(jī)39個(gè)模塊的算法詳細(xì)的資料，包括PMSM電機(jī)FOC控制的各個(gè)所有模塊程序算法分析，全是TI原版資料的一個(gè)整合包

2019-10-21 16:46:30

W82662ASC97_learnelectronics-cap-learning-v1

描述W82662ASC97_learnelectronics-cap-learning-v1用于教授電容器充電和放電的板。選擇帶跳線的帽子，按下按鈕。在放電階段，電容充電并點(diǎn)亮 LED。

2022-07-27 07:47:15

WCDMA/TD-SCDMA雙模手機(jī)可復(fù)用性分析，不看肯定后悔

本文首先簡單介紹W/TD 雙模手機(jī)收發(fā)機(jī)的整體架構(gòu)，然后對(duì)WCDMA 和TD-SCDMA 協(xié)議中外部收發(fā)機(jī)的信號(hào)流程進(jìn)行可復(fù)用性分析，并從上行和下行兩個(gè)方面分析了外部收發(fā)機(jī)中可復(fù)用的功能模塊。本文的分析基于3GPP-Release 7 版本。

2021-06-01 06:57:57

pid算法分析

pid算法分析，寫的很好，慢慢領(lǐng)悟

2015-08-09 16:20:08

《MATLAB優(yōu)化算法案例分析與應(yīng)用》

《MATLAB優(yōu)化算法案例分析與應(yīng)用》清華大學(xué)出版社《MATLAB優(yōu)化算法案例分析與應(yīng)用》這本書，給大家推薦一下這本書清華大學(xué)出版社《MATLAB優(yōu)化算法案例分析與應(yīng)用》這本書，給大家推薦一下這本書

2014-10-10 12:34:35

【分享】關(guān)于PID算法的文檔

這個(gè)是關(guān)于PID算法的文檔，只是轉(zhuǎn)發(fā)過來給大家

2015-08-08 15:15:45

什么是算法

看成是用于求解良說明的計(jì)算問題的工具，一般來說，問題陳述說明了期的輸人輸出關(guān)系，算法則描述一個(gè)特定的計(jì)算過程來實(shí)現(xiàn)該輸人/輸出關(guān)系如，我們可能需要把一個(gè)數(shù)列排成非遞減序，實(shí)際上，這個(gè)問題經(jīng)常出現(xiàn)，并且為引入許多標(biāo)準(zhǔn)的設(shè)計(jì)技術(shù)和分析工具提供了足夠的理由，下面是我們關(guān)于排序問題的形式定義輸入：x個(gè)數(shù)的一個(gè)序

2021-07-23 08:27:33

使用dijkstra算法的準(zhǔn)備工作

背景：在最近從事的項(xiàng)目開發(fā)過程中，需要使用到兩點(diǎn)之間的最短運(yùn)距的計(jì)算，類似高德地圖、百度地圖的路徑分析功能，然后計(jì)算出距離顯示對(duì)應(yīng)的規(guī)劃路徑；在網(wǎng)上瀏覽了許多關(guān)于路徑分析的相關(guān)文章，很多都是

2019-05-23 08:13:33

基于Qualcomm DSP算法集成分析與案例分享三

一.簡介這個(gè)系列博客博主給大家分享了基于Qualcomm DSP算法集成分析與案例分享，今天再給大家分享份干貨----ThunderSoft公司基于Qualcomm msm8996平臺(tái)的超聲波姿勢識(shí)別算法實(shí)例分析。二.超聲波姿勢識(shí)別算法(EL)實(shí)例分析圖1 圖2圖3圖4圖5圖6

2018-09-28 14:20:58

如何去解決TD LTE與TD-SCDMA及GSM系統(tǒng)共處的問題？

TD LTE系統(tǒng)與TD-SCDMA及GSM系統(tǒng)之間存在哪幾種干擾？如何使用確定性計(jì)算方法分析TD LTE與TD-SCDMA及GSM系統(tǒng)干擾的情況？如何去解決TD LTE與TD-SCDMA及GSM系統(tǒng)共處的問題？

2021-05-26 07:08:44

數(shù)值分析與算法

2018-10-27 09:40:28

數(shù)據(jù)結(jié)構(gòu)與算法分析

2012-06-05 10:46:50

求《labview8實(shí)用教程》配套的learning文件

本帖最后由 yueezer199198 于 2015-4-6 16:09 編輯小弟初學(xué)labview，自學(xué)的教材是《labview8實(shí)用教程》，但是沒有learning文件，所以進(jìn)展真的很慢，希望有這個(gè)文件的朋友幫個(gè)忙，十分感謝，本人新入論壇，真心沒有積分，家當(dāng)全壓上了

2015-03-30 20:13:44

求教一個(gè)關(guān)于算法到硬件實(shí)現(xiàn)的問題

本人大四，做一個(gè)關(guān)于腦電信號(hào)特征提取的算法分析，然后優(yōu)化后用硬件實(shí)現(xiàn)，要求比較簡單，就是只要能把腦電信號(hào)中比如α波或者β波分離出來，通過對(duì)基本節(jié)律的頻域分析，提取其基本的強(qiáng)度等特征，進(jìn)而對(duì)大腦實(shí)時(shí)

2013-05-15 19:15:24

經(jīng)典算法大全（51個(gè)C語言算法+單片機(jī)常用算法+機(jī)器學(xué)十大算法）

learning），又稱再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí)，學(xué)習(xí)不是單一方法，而是一種機(jī)器學(xué)習(xí)方式，在智能控制機(jī)器人及分析預(yù)測等領(lǐng)域有許多應(yīng)用。強(qiáng)化學(xué)習(xí)例子：馬爾可夫決策過程通用機(jī)器學(xué)習(xí)算法列表 1. 線性回歸

2018-10-23 14:31:12

請(qǐng)教一個(gè)關(guān)于fft算法的問題，DFT算法與FFT算法在應(yīng)用上有什么區(qū)別？

請(qǐng)教一個(gè)關(guān)于fft算法的問題，DFT算法與FFT算法在應(yīng)用上有什么區(qū)別？

2016-06-02 11:55:54

調(diào)試FPGA時(shí)，TD軟件是否支持內(nèi)部邏輯分析功能?

調(diào)試FPGA時(shí)，TD軟件是否支持內(nèi)部邏輯分析（抓波形）功能?

2023-08-11 10:32:27

算法設(shè)計(jì)與分析王曉東

算法設(shè)計(jì)與分析王曉東編著主要內(nèi)容介紹第1章算法引論第2章遞歸與分治策略第3章動(dòng)態(tài)規(guī)劃第4章貪心算法第5章回溯法第6章分支限

2008-11-25 23:50:55

算法設(shè)計(jì)與分析下載

算法設(shè)計(jì)與分析:以算法設(shè)計(jì)策略為知識(shí)單元，系統(tǒng)地介紹計(jì)算機(jī)算法的設(shè)計(jì)方法與分析技巧，以期為計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科的學(xué)生提供廣泛而堅(jiān)實(shí)的計(jì)算機(jī)算法基礎(chǔ)知識(shí)。系統(tǒng)地

2008-11-26 10:08:11

算法設(shè)計(jì)與分析pdf

算法設(shè)計(jì)與分析pdf文檔：以算法設(shè)計(jì)策略為知識(shí)單元，系統(tǒng)地介紹計(jì)算機(jī)算法的設(shè)計(jì)方法與分析技巧，以期為計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科的學(xué)生提供廣泛而堅(jiān)實(shí)的計(jì)算機(jī)算法基礎(chǔ)知識(shí)

2008-11-26 10:41:53

基于FCM算法的隱寫分析算法綜合評(píng)估

從與圖像隱寫分析算法評(píng)估相關(guān)的問題入手，分析隱寫分析算法評(píng)估的指標(biāo)，利用FCM 算法實(shí)現(xiàn)對(duì)各種隱寫分析算法的性能評(píng)估和比較。該評(píng)估算法不僅能對(duì)現(xiàn)有隱寫分析算法進(jìn)行評(píng)

2009-03-24 09:38:12

改進(jìn)的E-learning社區(qū)自組織算法

為了解決E-learning過程中缺乏對(duì)學(xué)習(xí)者有針對(duì)性指導(dǎo)的難題，該文提出一種構(gòu)建E-learning社區(qū)的改進(jìn)算法。該算法采用P2P的架構(gòu)，通過改進(jìn)的Hebbian學(xué)習(xí)法則不斷加強(qiáng)具有類似興趣的學(xué)

2009-04-15 09:29:36

TD-SCDMA網(wǎng)絡(luò)優(yōu)化方法與實(shí)例分析

TD-SCDMA網(wǎng)絡(luò)優(yōu)化方法與實(shí)例分析:TD-SCDMA是國際電聯(lián)公布的第三代移動(dòng)通信技術(shù)中的三大標(biāo)準(zhǔn)之一，我國從2006年開始推進(jìn)TD-SCDMA試驗(yàn)網(wǎng)絡(luò)建設(shè)。本文給出了TD-SCDMA網(wǎng)絡(luò)優(yōu)化的一些研究

2009-05-20 15:26:08

TD-SCDMA系統(tǒng)頻率規(guī)劃方法分析

TD-SCDMA系統(tǒng)頻率規(guī)劃方法分析:首先介紹了TD-SCDMA系統(tǒng)組網(wǎng)方式，接著重點(diǎn)分析比較了三種異頻組網(wǎng)方案，然后詳細(xì)闡述了其他組網(wǎng)策略的三個(gè)組網(wǎng)方案，最后對(duì)不同組網(wǎng)方式和組

2009-05-20 16:10:45

TD-SCDMA系統(tǒng)中的多載頻特性分析

TD-SCDMA系統(tǒng)中的多載頻特性分析:現(xiàn)有TD-SCDMA 規(guī)范主要是針對(duì)一個(gè)小區(qū)對(duì)應(yīng)一個(gè)單載頻的情形，它能夠滿足系統(tǒng)獨(dú)立組網(wǎng)的需求。為進(jìn)一步提高單載頻TD-SCDMA 系統(tǒng)的容量，滿足移動(dòng)

2009-05-21 16:31:34

TD-SCDMA KPI指標(biāo)及問題分析

TD-SCDMA KPI指標(biāo)及問題分析:本章目標(biāo):1：了解TD-SCDMA KPI指標(biāo)獲取方法2：熟悉TD-SCDMA系統(tǒng)中典型的KPI指標(biāo)3：掌握TD-SCDMA系統(tǒng)中某些重要KPI指標(biāo)含義4：熟悉TD-SCDMA信令流程與KPI

2009-05-22 13:45:42

TD-SCDMA路測及分析軟件的使用

TD-SCDMA路測及分析軟件的使用:本章目標(biāo):1：了解TD-SCDMA路測（DT）基本概念2：熟悉鼎利通信Pilot Pioneer軟件應(yīng)用3：熟悉鼎利通信Pilot Navigator軟件應(yīng)用4：掌握鼎利通信路測系

2009-05-22 13:47:11

123

TD SCDMA無線網(wǎng)絡(luò)優(yōu)化案例分析

TD-SCDMA無線網(wǎng)絡(luò)優(yōu)化案例分析:本章目標(biāo):1：熟悉TD-SCDMA弱覆蓋引起掉話情況2：掌握TD-SCDMA乒乓切換引起掉話情況3：熟悉TD-SCDMA信號(hào)波動(dòng)引起掉話情況4：掌握TD-SCDMA越區(qū)覆蓋

2009-05-22 13:48:13

TD_SCDMA移動(dòng)終端小區(qū)選擇的實(shí)現(xiàn)

TD_SCDMA移動(dòng)終端小區(qū)選擇的實(shí)現(xiàn):根據(jù)TD2SCDMA 系統(tǒng)的特點(diǎn), 通過對(duì)終端高層信令軟件、分層結(jié)構(gòu)及其各層功能的分析提出了空閑模式下小區(qū)選擇的一種實(shí)現(xiàn)算法, 這種算法能滿足各種

2009-05-22 16:28:40

TD-ERCS混沌系統(tǒng)的差分分析

TD-ERCS混沌系統(tǒng)的差分分析:基于差分分析基本原理和混沌系統(tǒng)“迭代”與分組密碼“輪”的對(duì)應(yīng)關(guān)系，提出了迭代差分分布和差分失效指數(shù)的概念，用于評(píng)估混沌系統(tǒng)抗差分分析的能

2009-10-20 13:24:25

TD-SCDMA網(wǎng)絡(luò)測試儀中Uu接口的信令分析

TD-SCDMA網(wǎng)絡(luò)測試儀中Uu接口的信令分析:TD-SCDMA系統(tǒng)是TDMA和CDMA 2種基本傳輸模式的靈活結(jié)合。TD-SCDMA系統(tǒng)特別適合在城市人口密集地區(qū)提供高密度大容量話音、數(shù)據(jù)和多媒體業(yè)務(wù)。系

2009-11-13 18:52:31

TD-SCDMA中的智能天線技術(shù)

簡要介紹了由我國提交并被國際電聯(lián)接受的第三代移動(dòng)通信標(biāo)準(zhǔn)TD-SCDMA系統(tǒng)及其特點(diǎn)，詳細(xì)闡述了智能天線的概念、自適應(yīng)算法和波束形成方法，深入分析了智能天線在TD-SCDMA系統(tǒng)中

2009-11-28 13:45:15

關(guān)于TD-SCDMA直放站具體應(yīng)用若干問題的探討

關(guān)于TD-SCDMA直放站具體應(yīng)用若干問題的探討:在信息產(chǎn)業(yè)部相關(guān)部門組織下，已有三家運(yùn)營商在全國三個(gè)城市保定、廈門、青島組織TD-SCDMA的規(guī)模試驗(yàn)網(wǎng)測試，引起了通信界對(duì)TD-SCDMA技

2010-01-16 15:23:55

基于Q-Learning的認(rèn)知無線電系統(tǒng)感知管理算法

認(rèn)知無線電系統(tǒng)不僅是一個(gè)自適應(yīng)系統(tǒng)，更應(yīng)該是一個(gè)智能系統(tǒng)。該文將智能控制中的Q-Learning 思想引入到認(rèn)知無線電系統(tǒng)中，用于解決感知任務(wù)在認(rèn)知用戶之間的分配問題，給出了

2010-03-06 10:46:26

蘇泊爾TD0501T、TD0501CT、TD0504T、TD

蘇泊爾TD0501T、TD0501CT、TD0504T、TD0505T型電磁爐電路圖,原理圖，圖紙。

2010-04-09 08:45:08

558

TD HSPA+ 關(guān)鍵技術(shù)分析

2010-08-02 15:00:14

TD-LTE測量要點(diǎn)分析

TD-LTE測量要點(diǎn)分析 3G(third-generation)無線系統(tǒng)正在全球展開部署。W-CDMA通過在下行和上行中增加HSPA(highspeedpacketaccess)以保持著中期競爭優(yōu)勢，它使得小區(qū)峰值速率可達(dá)到7

2009-06-16 14:05:41

494

3G增強(qiáng)技術(shù)在TD-SCDMA中的應(yīng)用及發(fā)展

摘要　簡要介紹了TD-SCDMA系統(tǒng)及其特點(diǎn)，著重闡述了TD-SCDMA系統(tǒng)增強(qiáng)型技術(shù)HSDAP和HSUPA，最后分析了TD-SCDMA增強(qiáng)型技術(shù)的發(fā)展趨勢。 1、TD-SCDMA系統(tǒng)及其特點(diǎn) 　

2009-06-18 09:05:30

579

TD-SCDMA直放站同步方式分析

摘要文章首先介紹了TD-SCDMA制式信號(hào)物理層的幀結(jié)構(gòu)的特點(diǎn)，進(jìn)而分析了目前TD-SCDMA直放站可以采用的四種同步方式的原理和優(yōu)缺點(diǎn)。 1、背

2009-06-18 09:13:09

786

TD-SCDMA網(wǎng)絡(luò)模擬儀核心網(wǎng)模擬功能分析

TD-SCDMA網(wǎng)絡(luò)模擬儀核心網(wǎng)模擬功能分析摘要： TD-SCDMA網(wǎng)絡(luò)模擬儀是杰脈通信最新推出的一款具有TD-SCDMA基站和核心網(wǎng)模擬功能的調(diào)測設(shè)備。它不僅支持終端系統(tǒng)級(jí)的功能

2010-01-04 14:15:30

844

分析稱今年TD芯片整體出貨或達(dá)2000萬

分析稱今年TD芯片整體出貨或達(dá)2000萬從芯片廠商ST-Ericsson了解到，加上今年前3個(gè)月，ST-Ericsson旗下子公司天碁（T3G）的TD-SCDMA芯片累計(jì)出貨已經(jīng)突破1

2010-03-30 10:03:34

344

TD-LTE網(wǎng)絡(luò)覆蓋性能分析

2011-01-06 16:00:47

TD-SCDMA基站覆蓋和容量分析

本文將從覆蓋和容量兩方面完整分析TD-SCDMA基站的能力，為TD-SCDMA后期大規(guī)模的試驗(yàn)及商用提供理論指導(dǎo)依據(jù)。這其中，智能天線、聯(lián)合檢測等關(guān)鍵技術(shù)大大降低了TD-SCDMA系統(tǒng)的干擾，從

2011-03-24 15:00:34

107

TD-MRR在TD網(wǎng)絡(luò)質(zhì)量分析中的應(yīng)用

1 TD網(wǎng)優(yōu)方式急需變革在TD一、二期的網(wǎng)優(yōu)工作中，業(yè)界普遍采用DT/CQT的方式，即通過撥打測試的方式對(duì)網(wǎng)絡(luò)的覆蓋、干擾、質(zhì)量等測量指標(biāo)進(jìn)行評(píng)價(jià)。由于是基于點(diǎn)、線等測試得到的結(jié)

2011-03-28 16:09:45

TD-LTE技術(shù)原理介紹

關(guān)于TD-LTE技術(shù)的內(nèi)涵的詳細(xì)介紹，以及實(shí)際的應(yīng)用可能和領(lǐng)域。

2011-09-29 18:54:22

297

TD-LTE技術(shù)交流

本文是關(guān)于TD-LTE的熱門技術(shù)點(diǎn)的探討，值得收藏！

2011-11-01 17:59:32

中移動(dòng)TD手機(jī)招標(biāo)細(xì)節(jié)及TD智能機(jī)市場競爭分析

　　眾人期待的600萬TD-SCDMA手機(jī)大招標(biāo)于近日揭曉，雖還未在官方網(wǎng)站公布，但是業(yè)內(nèi)基本上已知曉。為滿足更多未知讀者，昌旭特寫此文，與大家共享，并會(huì)分析一下未來TD芯片的競爭

2012-05-30 09:04:49

1187

《啊哈！算法》試讀_關(guān)于算法的書籍

這是一本講關(guān)于算法的書籍，講的非常生動(dòng)有趣，把枯燥轉(zhuǎn)化為有趣的小知識(shí)，很適合新手學(xué)習(xí)

2015-10-28 14:44:46

基于deep_learning的語音識(shí)別

針對(duì)目前智能計(jì)算機(jī)及大規(guī)模數(shù)據(jù)的發(fā)展，依據(jù)大腦處理語音、圖像數(shù)據(jù)方法的deep learning技術(shù)應(yīng)運(yùn)而生。傳統(tǒng)的語音識(shí)別技術(shù)對(duì)特征篩選的人工技能要求高，而且準(zhǔn)確率低。deep learning

2015-12-24 16:05:25

算法設(shè)計(jì)與分析

算法設(shè)計(jì)與分析相關(guān)知識(shí)介紹有需要的朋友下來看看

2015-12-30 15:32:32

Learning OpenCV中文版

Learning OpenCV中文版，超級(jí)經(jīng)典opencv入門手冊(cè)，值得收藏學(xué)習(xí)。

2016-08-26 14:12:28

Programming 16-bit Microcontrollers in C Learning to Fly the PIC24

Programming 16-bit Microcontrollers in C Learning to Fly the PIC24

2017-10-09 14:32:17

TD網(wǎng)優(yōu)方式及最佳選擇

TD MRR工具目前已經(jīng)開始在福建、北京等地展開應(yīng)用，并取得了預(yù)期的效果。相信TD MRR工具必將在TD三期網(wǎng)絡(luò)優(yōu)化工作中發(fā)揮其評(píng)估結(jié)果準(zhǔn)確、分析效率高和節(jié)省人力、物力的優(yōu)勢，大幅提升網(wǎng)優(yōu)效率，成為TD網(wǎng)絡(luò)質(zhì)量分析的利器。

2017-10-14 10:54:51

基于Zodiac密碼算法零相關(guān)線性分析

了一些關(guān)于Zodiac算法的10輪零相關(guān)線性逼近，然后對(duì)16輪20diac-192進(jìn)行了多維零相關(guān)分析。分析結(jié)果顯示：攻擊過程中一共恢復(fù)了19個(gè)字節(jié)的密鑰，其數(shù)據(jù)復(fù)雜度約為2-124個(gè)明密文對(duì)，計(jì)算

2017-12-01 10:41:25

兼具動(dòng)態(tài)規(guī)劃DP和蒙特卡洛MC優(yōu)點(diǎn)的TD Learning算法

TD Learning（Temporal－Difference Learning）時(shí)序差分學(xué)習(xí)指的是一類無模型的強(qiáng)化學(xué)習(xí)方法，它是從當(dāng)前價(jià)值函數(shù)估計(jì)的自舉過程中學(xué)習(xí)的。這些方法從環(huán)境中取樣，如蒙特卡洛方法，并基于當(dāng)前估計(jì)執(zhí)行更新，如動(dòng)態(tài)規(guī)劃方法。

2018-06-29 17:16:00

3218

哈夫曼算法的理解及原理分析,算法實(shí)現(xiàn),構(gòu)造哈夫曼樹的算法

哈夫曼樹是一種樹形結(jié)構(gòu)，用哈夫曼樹的方法解編程題的算法就叫做哈夫曼算法。樹并不是指植物，而是一種數(shù)據(jù)結(jié)構(gòu)。下面我們；來看看哈夫曼算法的原理分析以及構(gòu)造哈夫曼樹的算法

2017-12-11 09:24:26

34097

基于Q-learning的碼率控制算法

的發(fā)展趨勢。 HAS采用碼流切換技術(shù)動(dòng)態(tài)調(diào)整碼率，整個(gè)過程由自適應(yīng)算法負(fù)責(zé)?？捎脦捁浪愫痛a率選擇是客戶端碼率自適應(yīng)算法的2個(gè)核心功能。根據(jù)媒體片段的TCP平均下載吞吐量估算網(wǎng)絡(luò)帶寬。碼率決策從視頻碼率集中選擇低于估算網(wǎng)絡(luò)可用帶寬的最大碼率等級(jí)。這種碼率選

2018-01-10 10:29:57

Matlab關(guān)于Apriori算法設(shè)計(jì)

本文詳細(xì)介紹了Matlab關(guān)于Apriori算法設(shè)計(jì)。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法Apriori使用一種稱作逐層搜索的迭代方法，“K-1項(xiàng)集”用于搜索“K項(xiàng)集”。

2018-02-02 16:20:15

4851

關(guān)于c語言編寫的算法程序

關(guān)于c語言編寫的算法程序

2018-04-09 17:47:47

Q Learning算法學(xué)習(xí)

Q Learning算法是由Watkins于1989年在其博士論文中提出，是強(qiáng)化學(xué)習(xí)發(fā)展的里程碑，也是目前應(yīng)用最為廣泛的強(qiáng)化學(xué)習(xí)算法。

2018-07-05 14:10:00

3368

TD-LTE的室內(nèi)分布系統(tǒng)如何設(shè)計(jì)詳細(xì)設(shè)計(jì)方法概述

分布系統(tǒng)干擾分析，4.TD-LTE室內(nèi)覆蓋性能分析，5.TD-LTE室內(nèi)建設(shè)方案分析，6.TD-LTE室內(nèi)覆蓋規(guī)劃設(shè)計(jì)

2018-12-12 16:25:51

為 Learning-to-Rank 打造的可擴(kuò)展 TensorFlow 庫

我們很高興與諸位分享 TF-Ranking，這是一個(gè)專為 Learning-to-Rank 打造的可擴(kuò)展的 TensorFlow 庫。

2018-12-22 09:26:04

3908

TD-LTE和FDD LTE的對(duì)比分析資料免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是TD-LTE和FDD LTE的對(duì)比分析資料免費(fèi)下載包括了：1 TD-LTE關(guān)鍵技術(shù)與業(yè)界進(jìn)展，2 TD-LTE/FDD LTE技術(shù)比較，3 TD-LTE/FDD LTE性能比較，4 TD-LTE/FDD LTE的干擾區(qū)別.

2019-07-08 08:00:00

機(jī)器學(xué)習(xí)有哪一些算法

機(jī)器學(xué)習(xí)（Machine Learning， ML）是一門多領(lǐng)域交叉學(xué)科，涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。

2019-07-08 10:05:05

721

淺談Q-Learning和SARSA時(shí)序差分算法

Q-Learning這一篇對(duì)應(yīng)Sutton書的第六章部分和UCL強(qiáng)化學(xué)習(xí)課程的第五講部分。 1. Q-Learning算法的引入 Q-Learning算法是一種使用時(shí)序差分求解強(qiáng)化學(xué)習(xí)控制問題的方法

2020-11-04 14:05:28

2530