RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

集成電路應(yīng)用雜志 ? 來(lái)源:cc ? 2019-02-14 14:45 ? 次閱讀

1 引言

大數(shù)據(jù)處理系統(tǒng)始終是分析大數(shù)據(jù)的基礎(chǔ),因?yàn)榇髷?shù)據(jù)本身具有信息量繁多冗雜、擴(kuò)展速度極快、信息多樣性且價(jià)值密度高等特點(diǎn),所以要求大數(shù)據(jù)處理系統(tǒng)具有極強(qiáng)的專業(yè)性和高效性,能夠合理并有效的處理大規(guī)模的數(shù)據(jù)并形成可用的數(shù)據(jù)體系[1-3]。目前較為典型的大數(shù)據(jù)處理系統(tǒng)有三種。分別為大數(shù)據(jù)實(shí)時(shí)流式處理系統(tǒng)、離線批量處理系統(tǒng)、交互式處理系統(tǒng)以及大數(shù)據(jù)可視化處理系統(tǒng),本文將依次介紹這三種大數(shù)據(jù)處理系統(tǒng)的概念及其特點(diǎn)并分析其應(yīng)用場(chǎng)景。

2 實(shí)時(shí)流式處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)流式大數(shù)據(jù)概念及其特點(diǎn)。流式大數(shù)據(jù)又被稱為實(shí)時(shí)大數(shù)據(jù),流式處理系統(tǒng)是以分析實(shí)時(shí)數(shù)據(jù)為基礎(chǔ),是基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理,一般處理時(shí)間是在數(shù)百毫秒到數(shù)秒之間。

(2)大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)的技術(shù)架構(gòu)。根據(jù)大數(shù)據(jù)實(shí)時(shí)流式處理的特點(diǎn)可以總結(jié)出,這種數(shù)據(jù)處理系統(tǒng)其實(shí)就是數(shù)據(jù)的收集、傳輸、處理和展現(xiàn)的過(guò)程。其中數(shù)據(jù)的處理中涉及數(shù)據(jù)的聚合,而且整個(gè)過(guò)程需要能夠在秒級(jí)或毫秒級(jí)得到相應(yīng)的響應(yīng)。目前針對(duì)這一系列特點(diǎn)形成了 Flume + kafka + Storm / Spark + Hbase / Redis 的技術(shù)框架。

(3)大數(shù)據(jù)實(shí)時(shí)流式處理系統(tǒng)的應(yīng)用場(chǎng)景。流式大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)主要廣泛應(yīng)用于金融、公安、電信、交通等領(lǐng)域,在金融行業(yè),流式大數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)在金融風(fēng)控反欺詐方面發(fā)揮著重要作用,能夠搜集融合眾多專家知識(shí)以及機(jī)器研究結(jié)果的數(shù)百條規(guī)則,作為對(duì)每筆交易的風(fēng)險(xiǎn)評(píng)估依據(jù),判斷該筆交易是否能夠安全進(jìn)行。

3 離線處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)大數(shù)據(jù)離線處理系統(tǒng)概念及其特點(diǎn)。根據(jù)數(shù)據(jù)分析的時(shí)效性,我們可以把大數(shù)據(jù)分析處理系統(tǒng)分為實(shí)時(shí)處理和離線處理兩種類型。

(2)大數(shù)據(jù)離線處理處理系統(tǒng)的常用工具。相對(duì)于在線處理系統(tǒng)所呈現(xiàn)的技術(shù)架構(gòu),大數(shù)據(jù)離線處理系統(tǒng)已經(jīng)相對(duì)成熟,大數(shù)據(jù)離線處理的流程通常是利用 Hdfs 存儲(chǔ)數(shù)據(jù),確保數(shù)據(jù)有效存儲(chǔ)之后,再利用 MapReduce 進(jìn)行離線數(shù)據(jù)的批量運(yùn)算,批量計(jì)算所得出的數(shù)據(jù)如果需要進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行存儲(chǔ),可以直接接入 Hive,用過(guò) Hive 進(jìn)行展示。① Hdfs 是一種分布式的文件系統(tǒng),可以對(duì)數(shù)據(jù)進(jìn)行多次備份。② MapReduce 是一種批量計(jì)算技術(shù)框架,同樣是分布式布局,分為兩個(gè)階段:Map 階段和 Reduce 階段。③ Hive 中的數(shù)據(jù)存儲(chǔ)于文件系統(tǒng)中,并且大部分?jǐn)?shù)據(jù)是使用 Hdfs 來(lái)存儲(chǔ)的。Hive 為方便訪問數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)提供了一種方法,HQL 方法,該方法能夠滿足大數(shù)據(jù)離線處理中需要對(duì)批量處理的數(shù)據(jù)結(jié)果進(jìn)行查詢的要求。

(3)大數(shù)據(jù)離線處理系統(tǒng)目前較常見的應(yīng)用場(chǎng)景是,大數(shù)據(jù)團(tuán)隊(duì)通過(guò)統(tǒng)一計(jì)算引擎入口,降低用戶接入門檻。充分利用集群本身數(shù)據(jù),有效促進(jìn)集群本身的建設(shè),加強(qiáng)對(duì)隊(duì)列、任務(wù)及主機(jī)失敗率的監(jiān)控,使用戶能夠自主分析任務(wù)性能并進(jìn)行自主調(diào)整。

4 交互可視化處理系統(tǒng)及應(yīng)用場(chǎng)景

(1)大數(shù)據(jù)交互可視化處理的概念及其特點(diǎn)。大數(shù)據(jù)交互可視化處理是將大數(shù)據(jù)形象化,可視化也就是將數(shù)據(jù)呈現(xiàn)出可視效果。大數(shù)據(jù)交互可視化處理具有兩個(gè)特點(diǎn):首先表現(xiàn)方式多樣化,包括圖形、地圖、故事情節(jié)圖、結(jié)構(gòu)化插圖等。其次是適用范圍廣泛,具有領(lǐng)域創(chuàng)新性,隨著大數(shù)據(jù)的發(fā)展,傳統(tǒng)的數(shù)據(jù)表現(xiàn)形式已經(jīng)不能滿足需要,就要求對(duì)數(shù)據(jù)進(jìn)行可視化處理。

(2)大數(shù)據(jù)交互可視化處理的主要手段。① D3 經(jīng)常出現(xiàn)在表格插件中,是目前最受歡迎的可視化庫(kù)之一。D3 可以將數(shù)據(jù)綁定到 DOM 并將其驅(qū)動(dòng)轉(zhuǎn)移應(yīng)用到 Document 之中。同時(shí) D3 是繪制交互桑葚圖的一種非常簡(jiǎn)單的工具,桑葚圖也就是桑葚能量分流圖,它作為一種類型獨(dú)特的流程圖,一般多用于能源、金融等大數(shù)據(jù)的可視化分析。另外,D3 也可以作為對(duì) Sunburst Partition 的可視化工具,主要用來(lái)描述用戶群體的路徑點(diǎn)擊狀況。② ECharts 即商業(yè)級(jí)數(shù)據(jù)圖表,可以在 PC 端和移動(dòng)設(shè)備上流暢運(yùn)行的純 Javascript 圖表庫(kù),為我們提供生動(dòng)形象,可交互,可個(gè)性定制的大數(shù)據(jù)可視化圖表,能夠高效增強(qiáng)用戶體驗(yàn)效果。③ R 語(yǔ)言是目前功能比較強(qiáng)大的大數(shù)據(jù)可視化解決路徑,R 語(yǔ)言基本可以獨(dú)立自主地完成數(shù)據(jù)處理、可視化分析、建模以及模型分析等工作,同時(shí)可以作為配合完成與其他工具的數(shù)據(jù)交互。

除此之外,R 語(yǔ)言能夠完成頂尖的制圖工作,不僅可以完成lattcie 包、ggplot2 包的復(fù)雜數(shù)據(jù)可視化,還可以完成rCharts 包、recharts 包、plotly 包的數(shù)據(jù)交互可視化。

(3)大數(shù)據(jù)交互可視化處理的應(yīng)用場(chǎng)景。大數(shù)據(jù)作為一個(gè)新的研究領(lǐng)域在近幾年受到越來(lái)越多的關(guān)注,大數(shù)據(jù)可視化也正成為一大熱點(diǎn)。以下將介紹三種大數(shù)據(jù)交互可視化較典型的應(yīng)用場(chǎng)景。

第一是應(yīng)用于社會(huì)關(guān)系的可視化,隨著移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)已成為十分重要的數(shù)據(jù)資源,社會(huì)網(wǎng)絡(luò)分析就是利用這些數(shù)據(jù)資源分析各種網(wǎng)絡(luò)現(xiàn)象。另外,用戶社交性設(shè)計(jì)在最近幾年的移動(dòng)端網(wǎng)游中也受到越來(lái)越多的關(guān)注和重視,用戶社交型設(shè)計(jì)就需要以數(shù)據(jù)交互可視化為基礎(chǔ),從而建立并美化游戲模式,增強(qiáng)用戶游戲體驗(yàn)。

第二個(gè)應(yīng)用場(chǎng)景是地理信息的可視化。例如百度遷移圖,就是基于大數(shù)據(jù)可視化的地理信息可視化的典型例子,可以通過(guò)分析處理動(dòng)態(tài)數(shù)據(jù),將數(shù)據(jù)進(jìn)行動(dòng)態(tài)連線處理,從而形成流向圖,一目了然。除此之外也可以利用 Remap 實(shí)現(xiàn)天氣預(yù)報(bào)的功能,也可以實(shí)現(xiàn)會(huì)議在地圖上的可視化,如中國(guó) 2015 年 R 語(yǔ)言會(huì)議在各個(gè)城市舉行情況的可視化展示。近幾年較為流行的另外一種地理信息可視化方式是城市熱力圖,圖示以不同深淺的顏色來(lái)表示各個(gè)地區(qū)的實(shí)際數(shù)據(jù)。

第三是美國(guó)大選的大數(shù)據(jù)可視化,在美國(guó)大選期間,美國(guó)媒體產(chǎn)出大量選舉相關(guān)的數(shù)據(jù)報(bào)道,通過(guò)對(duì)這些大數(shù)據(jù)的可視化,選民可以清晰了解選舉動(dòng)態(tài)。通過(guò)以上幾種大數(shù)據(jù)可視化的典型例子,我們可以看出,大數(shù)據(jù)可視化是一個(gè)具有多種可能,且并不難以實(shí)現(xiàn)的大數(shù)據(jù)處理系統(tǒng),而且具有極大的發(fā)展空間。

5 結(jié)語(yǔ)

大數(shù)據(jù)處理系統(tǒng)會(huì)隨著大數(shù)據(jù)研究的深入以及數(shù)據(jù)處理技術(shù)的發(fā)展而更加多元更加完善,也將會(huì)在更多行業(yè)或領(lǐng)域中被實(shí)際應(yīng)用。大數(shù)據(jù)已經(jīng)深入到我們生活的方方面面,如何能夠更有效更充分挖掘大數(shù)據(jù)中的價(jià)值仍需要不斷地研究和探索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    93

    瀏覽量

    16673
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8882

    瀏覽量

    137396

原文標(biāo)題:大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

文章出處:【微信號(hào):appic-cn,微信公眾號(hào):集成電路應(yīng)用雜志】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    緩存對(duì)大數(shù)據(jù)處理的影響分析

    緩存對(duì)大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個(gè)方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲(chǔ)通常采用分布式存儲(chǔ)系統(tǒng),
    的頭像 發(fā)表于 12-18 09:45 ?98次閱讀

    cmp在數(shù)據(jù)處理中的應(yīng)用 如何優(yōu)化cmp性能

    ,然后在多個(gè)處理器上并行處理,顯著提高了數(shù)據(jù)處理的速度和吞吐量。 1. CMP在大數(shù)據(jù)處理中的應(yīng)用 在大數(shù)據(jù)處理中,CMP技術(shù)可以應(yīng)用于
    的頭像 發(fā)表于 12-17 09:27 ?213次閱讀

    eda中常用的數(shù)據(jù)處理方法

    探索性數(shù)據(jù)分析(EDA)是一種統(tǒng)計(jì)方法,用于使用統(tǒng)計(jì)圖表、圖形和計(jì)算來(lái)發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢(shì)和異常值。在進(jìn)行EDA時(shí),數(shù)據(jù)處理是至關(guān)重要的,因?yàn)樗梢詭椭覀兏玫乩斫?/div>
    的頭像 發(fā)表于 11-13 10:57 ?289次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲(chǔ)系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析
    的頭像 發(fā)表于 11-12 09:44 ?232次閱讀

    海量數(shù)據(jù)處理需要多少RAM內(nèi)存

    海量數(shù)據(jù)處理所需的RAM(隨機(jī)存取存儲(chǔ)器)內(nèi)存量取決于多個(gè)因素,包括數(shù)據(jù)的具體規(guī)模、處理任務(wù)的復(fù)雜性、數(shù)據(jù)庫(kù)管理系統(tǒng)的效率以及所使用軟件的優(yōu)
    的頭像 發(fā)表于 11-11 09:56 ?286次閱讀

    FPGA在數(shù)據(jù)處理中的應(yīng)用實(shí)例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在數(shù)據(jù)處理領(lǐng)域有著廣泛的應(yīng)用,其高度的靈活性和并行處理能力使其成為許多高性能數(shù)據(jù)處理系統(tǒng)的核心組件。以下是一些FPGA在數(shù)據(jù)處理中的應(yīng)用實(shí)例: 一、通信協(xié)議
    的頭像 發(fā)表于 10-25 09:21 ?312次閱讀

    電源模塊測(cè)試系統(tǒng)ATE的數(shù)據(jù)報(bào)告與數(shù)據(jù)分析功能

    自動(dòng)化測(cè)試與數(shù)據(jù)收集分析于一體的綜合測(cè)試軟件,打破了傳統(tǒng)測(cè)試系統(tǒng)數(shù)據(jù)處理系統(tǒng)分散獨(dú)立的限制,提供了一站式自動(dòng)化測(cè)試服務(wù)體驗(yàn),讓電源模塊測(cè)試更智能高效。
    的頭像 發(fā)表于 09-10 18:34 ?346次閱讀
    電源模塊測(cè)試<b class='flag-5'>系統(tǒng)</b>ATE的<b class='flag-5'>數(shù)據(jù)</b>報(bào)告與<b class='flag-5'>數(shù)據(jù)分析</b>功能

    如何構(gòu)建一個(gè)基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測(cè)數(shù)據(jù)處理系統(tǒng)

    如何構(gòu)建一個(gè)基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測(cè)數(shù)據(jù)處理系統(tǒng) 構(gòu)建一個(gè)綜合性的數(shù)據(jù)處理和存儲(chǔ)系統(tǒng),該系統(tǒng)將集成郵件監(jiān)控、數(shù)據(jù)解析、文件
    的頭像 發(fā)表于 09-10 18:14 ?238次閱讀

    推動(dòng)智慧交通建設(shè),邊緣計(jì)算賦能交通信號(hào)燈數(shù)據(jù)處理與決策能力

    隨著智慧城市建設(shè)的快速發(fā)展,智慧交通已成為城市發(fā)展的重要組成項(xiàng)目。智慧交通旨在通過(guò)大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等先進(jìn)技術(shù),實(shí)現(xiàn)交通系統(tǒng)的全面感知、智能分析、主動(dòng)服務(wù)和協(xié)同管理。邊緣計(jì)算在交通信號(hào)燈物聯(lián)網(wǎng)
    的頭像 發(fā)表于 07-25 16:04 ?699次閱讀
    推動(dòng)智慧交通建設(shè),邊緣計(jì)算賦能交通信號(hào)燈<b class='flag-5'>數(shù)據(jù)處理</b>與決策能力

    基于MATLAB的信號(hào)處理系統(tǒng)分析

    基于MATLAB的信號(hào)處理系統(tǒng)分析,包括信號(hào)的導(dǎo)入、預(yù)處理、分析、特征提取以及頻譜分析等關(guān)鍵步驟,并通過(guò)實(shí)例展示MATLAB在信號(hào)
    的頭像 發(fā)表于 05-17 14:24 ?1056次閱讀

    如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇

    SSD速度通過(guò)NVMe接口得到了大幅提升,并且網(wǎng)絡(luò)傳輸速率也進(jìn)入了新的高度,但CPU主頻發(fā)展并未保持同等步調(diào),3GHz左右的核心頻率已成為常態(tài)。 在當(dāng)前背景下Apache Spark等大數(shù)據(jù)處理工具中,盡管存儲(chǔ)和網(wǎng)絡(luò)性能的提升極大地減少了數(shù)據(jù)讀取和傳輸?shù)臅r(shí)間消耗,但
    的頭像 發(fā)表于 04-02 13:45 ?1045次閱讀
    如何利用DPU加速Spark<b class='flag-5'>大數(shù)據(jù)處理</b>? | 總結(jié)篇

    上位機(jī)組成部分及工作原理圖

    上位機(jī)通常是指上層的控制系統(tǒng)或者數(shù)據(jù)處理系統(tǒng),是對(duì)下位機(jī)進(jìn)行監(jiān)控、控制和數(shù)據(jù)處理的設(shè)備。
    的頭像 發(fā)表于 03-05 16:33 ?3651次閱讀
    上位機(jī)組成部分及工作原理圖

    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的數(shù)據(jù)處理分析方法探討

    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的數(shù)據(jù)處理分析方法探討 在工程監(jiān)測(cè)領(lǐng)域,振弦采集儀是常用的一種設(shè)備,用于測(cè)量和記錄結(jié)構(gòu)物的振動(dòng)數(shù)據(jù)。數(shù)據(jù)處理分析
    的頭像 發(fā)表于 01-10 14:44 ?428次閱讀
    工程監(jiān)測(cè)領(lǐng)域振弦采集儀的<b class='flag-5'>數(shù)據(jù)處理</b>與<b class='flag-5'>分析</b>方法探討

    工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究

    工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究 工程監(jiān)測(cè)中振弦采集儀的數(shù)據(jù)處理方法研究是針對(duì)振弦采集儀所采集到的數(shù)據(jù)進(jìn)行分析處理,以獲得需要的監(jiān)測(cè)
    的頭像 發(fā)表于 01-09 15:10 ?361次閱讀
    工程監(jiān)測(cè)中振弦采集儀的<b class='flag-5'>數(shù)據(jù)處理</b>方法研究

    數(shù)據(jù)處理

    初學(xué)者想請(qǐng)教一下大家,采集的噪聲信號(hào),想要對(duì)采集到的數(shù)據(jù)累計(jì)到一定數(shù)量再進(jìn)行處理,計(jì)劃每隔0.2秒進(jìn)行一次數(shù)據(jù)處理,(得到均方根值等一些特征值)請(qǐng)問大家有什么方法可以實(shí)現(xiàn)
    發(fā)表于 01-07 10:11
    RM新时代网站-首页