RM新时代网站-首页

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

Spark分布式下的模糊C均值算法

大?。?/span>0.88 MB 人氣: 2017-12-23 需要積分:2

  針對聚類算法需要處理數(shù)據(jù)集的規(guī)模越來越大、時效性要求越來越高,對算法的大數(shù)據(jù)適應能力和性能要求更高的問題,提出一種在Spark分布式內(nèi)存計算平臺下的模糊C均值(FCM)算法Spark-FCM。首先對矩陣通過水平分割實現(xiàn)分布式存儲,不同向量存儲在不同節(jié)點;然后基于FCM算法的計算特點,設計了分布式和緩存敏感的常用矩陣操作,包括乘法、轉置和加法等;最后基于矩陣操作和Spark平臺特點,設計了Spark-FCM算法,主要數(shù)據(jù)結構采用分布式矩陣存儲,具有節(jié)點間數(shù)據(jù)移動少和每個步驟分布式計算特點。通過在單機和集群環(huán)境下測試,算法具有良好的可擴展性,并可以適應大規(guī)模數(shù)據(jù)集,算法性能與數(shù)據(jù)量成線性關系,集群環(huán)境下性能比單機提高2-3倍。

Spark分布式下的模糊C均值算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?
      RM新时代网站-首页