rm理财,新时代app游戏

目前大數(shù)據(jù)已經(jīng)成為了各家互聯(lián)網(wǎng)公司的核心資產(chǎn)和競(jìng)爭(zhēng)力了，其實(shí)不僅是互聯(lián)網(wǎng)公司，包括傳統(tǒng)企業(yè)也擁有大量的數(shù)據(jù)，也想把這些數(shù)據(jù)發(fā)揮出作用。在這種環(huán)境下，大數(shù)據(jù)技術(shù)的重要性和火爆程度相信沒(méi)有人去懷疑。

而AI 人工智能又是基于大數(shù)據(jù)技術(shù)基礎(chǔ)上發(fā)展起來(lái)的，大數(shù)據(jù)技術(shù)已經(jīng)很清晰了，但是AI目前還未成熟啊，所以本文就天馬行空一下，從大數(shù)據(jù)的技術(shù)變遷歷史中來(lái)找出一些端倪，猜一猜AI人工智能未來(lái)的發(fā)展。

最近斷斷續(xù)續(xù)的在看《極客時(shí)間》中「從0開(kāi)始學(xué)大數(shù)據(jù) 」專(zhuān)欄的文章，受益匪淺，學(xué)到了很多。尤其是非常喜歡作者李智慧講的那句話(huà)“學(xué)習(xí)大數(shù)據(jù)最好的時(shí)間是十年前，其次就是現(xiàn)在”，把這句話(huà)改到AI也適用，“學(xué)習(xí)AI最好的時(shí)間是十年前，其次就是現(xiàn)在”，任何知識(shí)都是這樣。下面我們就來(lái)詳細(xì)聊一聊。

一、先聊一聊大數(shù)據(jù)技術(shù)發(fā)展史？

我們使用的各種大數(shù)據(jù)技術(shù)，最早起源于Google當(dāng)年公布的三篇論文，Google FS（2003年）、MapReduce（2004年）、BigTable（2006年），其實(shí)Google當(dāng)時(shí)并沒(méi)有公布其源碼，但是已經(jīng)把這三個(gè)項(xiàng)目的原理和實(shí)現(xiàn)方式在公布的論文中詳細(xì)的描述了，這幾篇論文面世后，就引爆了行業(yè)的大數(shù)據(jù)學(xué)習(xí)和研究的浪潮。

隨后一個(gè)叫 Doug Cutting 的技術(shù)大牛（也就是寫(xiě) Lucene 的那位，做JAVA的同學(xué)應(yīng)該都很熟悉）就開(kāi)始根據(jù)Google公布的論文去開(kāi)發(fā)相關(guān)系統(tǒng)，后來(lái)慢慢發(fā)展成了現(xiàn)在的 Hadoop，包括 MapReduce 和 HDFS。

但是在當(dāng)時(shí)，使用 MapReduce 進(jìn)行數(shù)據(jù)分析和應(yīng)用還是有很大門(mén)檻的，畢竟要編寫(xiě) Map 和 Reduce 程序。只能大數(shù)據(jù)工程師上馬，普通BI分析師還是一臉懵逼。所以那個(gè)時(shí)候都是些大公司在玩。

既然有這么大門(mén)檻，就會(huì)有人勇于站出來(lái)去解決門(mén)檻，比如 Yahoo，他們開(kāi)發(fā)一個(gè)叫做 Pig 的東西，Pig是一個(gè)腳本語(yǔ)言，按照Pig的語(yǔ)法寫(xiě)出來(lái)的腳本可以編譯成 MapReduce 程序，然后直接在 Hadoop 上運(yùn)行了。

這個(gè)時(shí)候，大數(shù)據(jù)開(kāi)發(fā)的門(mén)檻確實(shí)降了一點(diǎn)。

不過(guò)，Pig大法雖好，但還是需要編寫(xiě)腳本啊，這還是碼農(nóng)的活兒啊。人們就在想，有沒(méi)有不用寫(xiě)代碼的方法就能做大數(shù)據(jù)計(jì)算呢，還真有，這個(gè)世界的進(jìn)步就是由一群善于思考的“懶人”推動(dòng)的。

于是，F(xiàn)acebook公司的一群高智商家伙發(fā)布了一個(gè)叫做 Hive 的東西，這個(gè) Hive 可以支持使用 SQL 語(yǔ)法直接進(jìn)行大數(shù)據(jù)計(jì)算。原理其實(shí)就是，你只需要寫(xiě)一個(gè)查詢(xún)的 SQL，然后 Hive 會(huì)自動(dòng)解析 SQL 的語(yǔ)法，將這個(gè)SQL 語(yǔ)句轉(zhuǎn)化成 MapReduce 程序去執(zhí)行。

這下子就簡(jiǎn)單了，SQL 是BI/數(shù)據(jù)分析師們最為常用的工具了，從此他們可以無(wú)視碼農(nóng)，開(kāi)開(kāi)心心的獨(dú)立去寫(xiě)Hive，去做大數(shù)據(jù)分析工作了。Hive從此就火爆了，一般公司的大多數(shù)大數(shù)據(jù)作業(yè)都是由Hive完成的，只有極少數(shù)較為復(fù)雜的需求才需要數(shù)據(jù)開(kāi)發(fā)工程師去編寫(xiě)代碼，這個(gè)時(shí)候，大數(shù)據(jù)的門(mén)檻才真真的降低了，大數(shù)據(jù)應(yīng)用也才真正普及，大大小小的公司都開(kāi)始在自己的業(yè)務(wù)上使用了。

但是，人們的追求不止如此，雖然數(shù)據(jù)分析便利了，但是大家又發(fā)現(xiàn) MapReduce 程序執(zhí)行效率不夠高啊，其中有多種原因，但有一條很關(guān)鍵，就是 MapReduce 主要是以磁盤(pán)作為存儲(chǔ)介質(zhì)，磁盤(pán)的性能極大的限制了計(jì)算的效率。

在這個(gè)時(shí)候，Spark 出現(xiàn)了，Spark 在運(yùn)行機(jī)制上、存儲(chǔ)機(jī)制上都要優(yōu)于 MapReduce ，因此大數(shù)據(jù)計(jì)算的性能上也遠(yuǎn)遠(yuǎn)超過(guò)了 MapReduce 程序，很多企業(yè)又開(kāi)始慢慢采用 Spark 來(lái)替代 MapReduce 做數(shù)據(jù)計(jì)算。

至此，MapReduce 和 Spark 都已成型，這類(lèi)計(jì)算框架一般都是按“天”為單位進(jìn)行數(shù)據(jù)計(jì)算的，因此我們稱(chēng)它們?yōu)椤按髷?shù)據(jù)離線(xiàn)計(jì)算”。既然有“離線(xiàn)計(jì)算”，那就必然也會(huì)有非離線(xiàn)計(jì)算了，也就是現(xiàn)在稱(chēng)為的“大數(shù)據(jù)實(shí)時(shí)計(jì)算”。

因?yàn)樵跀?shù)據(jù)實(shí)際的應(yīng)用場(chǎng)景中，以“天”為顆粒出結(jié)果還是太慢了，只適合非常大量的數(shù)據(jù)和全局的分析，但還有很多業(yè)務(wù)數(shù)據(jù)，數(shù)據(jù)量不一定非常龐大，但它卻需要實(shí)時(shí)的去分析和監(jiān)控，這個(gè)時(shí)候就需要“大數(shù)據(jù)實(shí)時(shí)計(jì)算”框架發(fā)揮作用了，這類(lèi)的代表有：Storm、Spark Streaming、Flink 為主流，也被稱(chēng)為流式計(jì)算，因?yàn)樗臄?shù)據(jù)源像水流一樣一點(diǎn)點(diǎn)的流入追加的。

當(dāng)然，除了上面介紹的那些技術(shù)，大數(shù)據(jù)還需要一些相關(guān)底層和周邊技術(shù)來(lái)一起支撐的，比如 HDFS 就是分布式文件系統(tǒng)，用于負(fù)責(zé)存儲(chǔ)數(shù)據(jù)的，HBase 是基于HDFS的NoSQL系統(tǒng)、與 HBase類(lèi)似的還有 Cassandra也都很熱門(mén)。

二、再看一看大數(shù)據(jù)技術(shù)架構(gòu)？

了解大數(shù)據(jù)相關(guān)技術(shù)可以先看下圖：

（圖片來(lái)源網(wǎng)絡(luò)）

這圖基本上很全面的展示了大數(shù)據(jù)的技術(shù)棧，下面將其主要的部分羅列一下，以便有個(gè)清晰的認(rèn)知：

大數(shù)據(jù)平臺(tái)基礎(chǔ)：

MapReduce，分布式離線(xiàn)計(jì)算框架
Spark，分布式離線(xiàn)計(jì)算框架
Storm，流式實(shí)時(shí)計(jì)算框架
Spark Streaming，流式實(shí)時(shí)計(jì)算框架
Flink，流式實(shí)時(shí)計(jì)算框架
Yarn，分布式集群資源調(diào)度框架
Oozie，大數(shù)據(jù)調(diào)度系統(tǒng)

分布式文件系統(tǒng)：

HDFS，分布式文件系統(tǒng)
GFS，分布式文件系統(tǒng)

SQL引擎：

Spark SQL （Shark），將SQL語(yǔ)句解析成Spark的執(zhí)行計(jì)劃在Spark上執(zhí)行
Pig，Yahoo的發(fā)布的腳本語(yǔ)言，編譯后會(huì)生成MapReduce程序
Hive，是Hadoop大數(shù)據(jù)倉(cāng)庫(kù)工具，支持SQL語(yǔ)法來(lái)進(jìn)行大數(shù)據(jù)計(jì)算，把SQL轉(zhuǎn)化MapReduce程序
Impala，Cloudera發(fā)布的運(yùn)行在HDFS上的SQL引擎

數(shù)據(jù)導(dǎo)入導(dǎo)出：

Sqoop，專(zhuān)門(mén)用將關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù) 批量導(dǎo)入導(dǎo)出到Hadoop
Canal，可以實(shí)時(shí) 將關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)導(dǎo)入到Hadoop

日志收集：

Flume，大規(guī)模日志分布式收集

大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)：

Mahout，Hadoop機(jī)器學(xué)習(xí)算法庫(kù)
Spark MLlib，Spark機(jī)器學(xué)習(xí)算法庫(kù)
TensorFlow，開(kāi)源的機(jī)器學(xué)習(xí)系統(tǒng)

三、猜一猜AI人工智能的發(fā)展？

通過(guò)上面的回顧，我們知道了，因?yàn)榇罅繑?shù)據(jù)的產(chǎn)生導(dǎo)致大數(shù)據(jù)計(jì)算技術(shù) MapReduce 的出現(xiàn)，又因?yàn)?MapReduce 的參與門(mén)檻問(wèn)題，導(dǎo)致了 Pig、Hive的出現(xiàn)，正是因?yàn)檫@類(lèi)上手容易的工具的出現(xiàn)，才導(dǎo)致大量的非專(zhuān)業(yè)化人員也能參與到大數(shù)據(jù)這個(gè)體系，因此導(dǎo)致了大數(shù)據(jù)相關(guān)技術(shù)的飛速發(fā)展和應(yīng)用，又從而進(jìn)一步推動(dòng)了機(jī)器學(xué)習(xí)技術(shù)的出現(xiàn)，有了現(xiàn)在的AI人工智能的發(fā)展。

但目前人工智能技術(shù)的門(mén)檻還比較高，并不是任何企業(yè)都能入場(chǎng)的，需要非常專(zhuān)業(yè)化的高端技術(shù)人才去參與，普通人員只能望而卻步，因此AI技術(shù)的應(yīng)用受到了極大的限制，所以也不斷的有人提出對(duì)人工智能提出質(zhì)疑。

講到這里，有沒(méi)有發(fā)現(xiàn)點(diǎn)什么問(wèn)題？

歷史的規(guī)律總是那么相似。可以猜測(cè)一下，人工智能的門(mén)檻有一天也會(huì)像 MapReduce 的開(kāi)發(fā)門(mén)檻一樣被打破，一旦人工智能的參與門(mén)檻降低了，各類(lèi)大小企業(yè)都能結(jié)合自己的業(yè)務(wù)場(chǎng)景進(jìn)入AI領(lǐng)域發(fā)揮優(yōu)勢(shì)了，那AI就真的進(jìn)入高速發(fā)展的通道了，AI相關(guān)實(shí)際應(yīng)用的普及就指日可待了。

恩，一定是這樣的，哈哈，現(xiàn)在就可以等著大牛們將AI的基礎(chǔ)平臺(tái)建設(shè)好，然后降低參與門(mén)檻，進(jìn)一步就迎來(lái)了AI的一片光明，大家從此就可以過(guò)上AI服務(wù)人類(lèi)的美好生活了（暢想中…）。

以上，就是從大數(shù)據(jù)技術(shù)變遷想到AI人工智能發(fā)展的一些想法。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238243
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8406

瀏覽量
132558
大數(shù)據(jù)

大數(shù)據(jù)

+關(guān)注

關(guān)注
64

文章
8882

瀏覽量
137394

評(píng)論

相關(guān)推薦

淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)近年來(lái)，隨著計(jì)算機(jī)、網(wǎng)絡(luò)以及圖像處理、傳輸技術(shù)的飛速發(fā)展，視頻監(jiān)控系統(tǒng)正向著高清化、智能化和網(wǎng)絡(luò)化方向

發(fā)表于 09-24 15:22

探尋大數(shù)據(jù)時(shí)代的商業(yè)變革

`科技的進(jìn)步在很多時(shí)候總會(huì)超出我們的想象。近年來(lái)，“大數(shù)據(jù)”一詞逐漸被大眾所熟知，人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù)，并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)時(shí)代已然來(lái)臨，它

發(fā)表于 05-27 17:11

常用大數(shù)據(jù)處理技術(shù)歸類(lèi)

“21世紀(jì)最缺的是什么?人才!”。在大數(shù)據(jù)發(fā)展如此之快的今天，大數(shù)據(jù)工程師已經(jīng)成為一個(gè)新興職業(yè)。大數(shù)據(jù)是信息技術(shù)，是人和人、人和

發(fā)表于 02-28 17:02

如何從零學(xué)大數(shù)據(jù)？

新如何學(xué)習(xí)大數(shù)據(jù)技術(shù)？大數(shù)據(jù)怎么入門(mén)？怎么做大數(shù)據(jù)分析？數(shù)據(jù)科學(xué)需要

發(fā)表于 03-01 15:41

常見(jiàn)大數(shù)據(jù)應(yīng)用有哪些?

擁有Java編程語(yǔ)言基礎(chǔ)的前提下，可以學(xué)習(xí)以上大數(shù)據(jù)技術(shù)，大數(shù)據(jù)是未來(lái)的發(fā)展方向，正在挑戰(zhàn)我們的分析能力及對(duì)世界的認(rèn)知方式，因此，我們與時(shí)俱

發(fā)表于 03-13 16:50

大數(shù)據(jù)專(zhuān)業(yè)技術(shù)學(xué)習(xí)之大數(shù)據(jù)處理流程

隨著互聯(lián)網(wǎng)的發(fā)展，大數(shù)據(jù)也在逐漸彰顯出自己的優(yōu)勢(shì)特點(diǎn)，那么關(guān)于大數(shù)據(jù)的處理流程，你是否了解?第一，數(shù)據(jù)采集定義：利用多種輕型數(shù)據(jù)庫(kù)來(lái)接收發(fā)自

發(fā)表于 06-11 16:41

大數(shù)據(jù)開(kāi)發(fā)核心技術(shù)詳解

數(shù)據(jù)的核心是云技術(shù)和BI。關(guān)于大數(shù)據(jù)和云計(jì)算的關(guān)系人們通常會(huì)有誤解，而且也會(huì)把它們混起來(lái)說(shuō)，分別做一句話(huà)直白解釋就是：云計(jì)算就是硬件資源的虛擬化;大數(shù)據(jù)就是海量

發(fā)表于 07-26 16:26

NLPIR大數(shù)據(jù)KGB知識(shí)圖譜引擎智能挖掘各行數(shù)據(jù)

挖掘方法)，智能建模分析(機(jī)器學(xué)習(xí)方法)，統(tǒng)計(jì)分析等?！　?b class='flag-5'>數(shù)據(jù)解釋?zhuān)簩?duì)于廣大的數(shù)據(jù)信息用戶(hù)來(lái)講，最關(guān)心的并非是

發(fā)表于 11-02 14:08

大數(shù)據(jù)平臺(tái)開(kāi)發(fā)公司有哪些？

推進(jìn)大數(shù)據(jù)技術(shù)發(fā)展的重要文件，緊接著又將大數(shù)據(jù)上升到了國(guó)家戰(zhàn)略層面。所有這一系列重要舉措，都證明了一件事情——當(dāng)下，正是大數(shù)據(jù)的風(fēng)口！在互聯(lián)網(wǎng)技術(shù)

發(fā)表于 11-15 15:17

NLPIR系統(tǒng)KGB知識(shí)圖譜技術(shù)助力大數(shù)據(jù)深度挖掘

”。且中國(guó)物聯(lián)網(wǎng)校企聯(lián)盟認(rèn)為，物聯(lián)網(wǎng)的發(fā)展離不開(kāi)大數(shù)據(jù)，依靠大數(shù)據(jù)可以提供足夠有利的資源?！　”本├砉ご髮W(xué)大數(shù)據(jù)搜索與挖掘實(shí)驗(yàn)室張華平主任研

發(fā)表于 12-05 11:49

阿里巴巴高級(jí)技術(shù)專(zhuān)家章劍鋒：大數(shù)據(jù)發(fā)展的 8 個(gè)要點(diǎn)

學(xué)習(xí)，實(shí)時(shí)更新機(jī)器學(xué)習(xí)模型目前以 Kafka，F(xiàn)link 為代表的流處理計(jì)算引擎已經(jīng)為實(shí)時(shí)計(jì)算提供了堅(jiān)實(shí)的底層技術(shù)支持，相信未來(lái)在實(shí)時(shí)可視化數(shù)據(jù)

發(fā)表于 10-14 10:56

大數(shù)據(jù)的定義及其應(yīng)用

目錄1、大數(shù)據(jù)概述1.1. 概述1.2. 大數(shù)據(jù)定義1.3. 大數(shù)據(jù)技術(shù)發(fā)展2、大數(shù)據(jù)應(yīng)用2.1. 大數(shù)

發(fā)表于 07-12 06:12

大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?

大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)

發(fā)表于 07-27 07:47

什么是大數(shù)據(jù)

，毅然決定學(xué)習(xí)大數(shù)據(jù)技術(shù)，進(jìn)入相關(guān)行業(yè)，而有的人還在觀望，不知道未來(lái)大數(shù)據(jù)前景怎么樣？今日博主有幸在1024"程序員節(jié)"上,為大家(更多是入門(mén)級(jí)的選...

發(fā)表于 08-31 08:52

大數(shù)據(jù)技術(shù)主要學(xué)什么 大數(shù)據(jù)技術(shù)就業(yè)方向

數(shù)據(jù)的技術(shù)。　　數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)： 數(shù)據(jù)

發(fā)表于 04-14 17:21 ?6551次閱讀

RM新时代网站-首页

搜索歷史

大數(shù)據(jù)技術(shù)發(fā)展史簡(jiǎn)介淺談大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

評(píng)論

淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

探尋大數(shù)據(jù)時(shí)代的商業(yè)變革

常用大數(shù)據(jù)處理技術(shù)歸類(lèi)

如何從零學(xué)大數(shù)據(jù)？

常見(jiàn)大數(shù)據(jù)應(yīng)用有哪些?

大數(shù)據(jù)專(zhuān)業(yè)技術(shù)學(xué)習(xí)之大數(shù)據(jù)處理流程

大數(shù)據(jù)開(kāi)發(fā)核心技術(shù)詳解

NLPIR大數(shù)據(jù)KGB知識(shí)圖譜引擎智能挖掘各行數(shù)據(jù)

大數(shù)據(jù)平臺(tái)開(kāi)發(fā)公司有哪些？

NLPIR系統(tǒng)KGB知識(shí)圖譜技術(shù)助力大數(shù)據(jù)深度挖掘

阿里巴巴高級(jí)技術(shù)專(zhuān)家章劍鋒：大數(shù)據(jù)發(fā)展的 8 個(gè)要點(diǎn)

大數(shù)據(jù)的定義及其應(yīng)用

大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?

什么是大數(shù)據(jù)

大數(shù)據(jù)技術(shù)主要學(xué)什么大數(shù)據(jù)技術(shù)就業(yè)方向

搜索歷史

大數(shù)據(jù)技術(shù)發(fā)展史簡(jiǎn)介 淺談大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

評(píng)論

大數(shù)據(jù)技術(shù)發(fā)展史簡(jiǎn)介淺談大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)