“大數(shù)據(jù)分析、可視化及BI領(lǐng)域
雖然這三個領(lǐng)域在功能及應用范圍上各有千秋,但實質(zhì)上可以說是相輔相成:通過大數(shù)據(jù)的基礎分析工具,研究人員可以獲得數(shù)據(jù)內(nèi)部的邏輯及結(jié)果表現(xiàn),但通常這些結(jié)果過于復雜并缺乏合理的表達形式,使數(shù)據(jù)科學家及企業(yè)的管理者無法快速領(lǐng)會并對經(jīng)營活動進行調(diào)整。
因此大數(shù)據(jù)的可視化方案應運而生,多數(shù)可視化方案都作為數(shù)據(jù)分析工具的延伸而存在,但也有少部分公司另辟蹊徑,采用非傳統(tǒng)方式將數(shù)據(jù)的可視化更加貼近需求。BI則是大數(shù)據(jù)分析和可視化與業(yè)務場景的結(jié)合,作為企業(yè)內(nèi)部管理工具,使企業(yè)的價值有了極大的增長,成為了大數(shù)據(jù)應用領(lǐng)域重要的一環(huán)。
大數(shù)據(jù)分析領(lǐng)域,在朝向易用、簡單化發(fā)展
大部分大數(shù)據(jù)分析企業(yè)的現(xiàn)狀,可以說是將數(shù)據(jù)的分析、可視化及數(shù)據(jù)的采集、治理、集成進行了一體化,以大數(shù)據(jù)的分析平臺形式存在。例如Fractal Analytics除了具備數(shù)據(jù)分析功能外,還提供自動化數(shù)據(jù)清理及驗證服務,能夠返回標準化的結(jié)構(gòu)化數(shù)據(jù); Voyager Labs則能夠?qū)崟r采集、分析遍布世界各地的數(shù)十億個數(shù)據(jù)點,幫助用戶進行預測。
上述典型公司主要面向大型企業(yè)進行定制化全流程服務,客單價有時高達千萬美元級別,例如Fractal Analytics的客戶就包括飛利浦、金佰利等大型公司,其高昂的價格及服務令小型企業(yè)望塵莫及。
但隨著大數(shù)據(jù)技術(shù)的逐漸普及,SaaS化的大數(shù)據(jù)分析服務將是一個明確的發(fā)展方向,而其使用門檻也將大幅降低,從而將大數(shù)據(jù)分析的能力逐步賦予給中小企業(yè),以真正的實現(xiàn)其基礎資源的價值。同時確保企業(yè)數(shù)據(jù)安全的數(shù)據(jù)脫敏、數(shù)據(jù)保護市場也會隨著SaaS化的到來而逐步拓展出新的市場空間。
目前大數(shù)據(jù)技術(shù)簡化、低成本、易用的趨勢已經(jīng)在部分公司的產(chǎn)品策略上有所體現(xiàn),例如大數(shù)據(jù)分析公司Domino的產(chǎn)品讓數(shù)據(jù)科學家只需專注于自己的分析工作,而不用關(guān)注軟硬件基礎設施的建立及維護,Datameer更進一步開發(fā)出的產(chǎn)品屏蔽了復雜的大數(shù)據(jù)分析底層技術(shù),通過類似電子表格的可視化數(shù)據(jù)分析用戶界面,讓企業(yè)的員工能夠快速上手使用,RapidMiner Studio可零代碼操作客戶端,實現(xiàn)機器學習、數(shù)據(jù)挖掘、文本挖掘、預測性分析等功能。
在大數(shù)據(jù)分析能力普及的同時,提升數(shù)據(jù)分析性能、優(yōu)化數(shù)據(jù)分析結(jié)果的技術(shù)研發(fā)也在快速進展中。例如SigOpt通過自主開發(fā)的貝葉斯優(yōu)化(Bayesian Optimization)算法來調(diào)整模型的參數(shù),獲得了比常見的網(wǎng)格搜索(grid searching technique)解決方案更快、更穩(wěn)定、更易于使用的結(jié)果,目前SigOpt 的產(chǎn)品不僅可以讓用戶測試不同變量,還能夠提供下一步的測試建議,以幫助用戶持續(xù)優(yōu)化改善數(shù)據(jù)分析結(jié)果。
令人感到欣喜的是,在大數(shù)據(jù)分析領(lǐng)域還存在著一些顛覆了傳統(tǒng)數(shù)據(jù)分析理論,采用獨特方式方法進行數(shù)據(jù)分析的公司。這類公司的技術(shù)對傳統(tǒng)數(shù)據(jù)分析方法進行了很好的補充,在特定領(lǐng)域有著成功的應用。
這類公司中的典型之一是由三位全球頂尖的數(shù)學家創(chuàng)立的Ayasdi,它利用拓撲數(shù)據(jù)分析技術(shù)和上百種機器學習的算法來處理復雜的數(shù)據(jù)集,不僅可以有效地捕捉高維數(shù)據(jù)空間的拓撲信息,而且擅長發(fā)現(xiàn)一些用傳統(tǒng)方法無法發(fā)現(xiàn)的小分類,這種方法目前在基因與癌癥研究領(lǐng)域大顯身手,例如一位醫(yī)生利用Ayasdi的數(shù)據(jù)分析技術(shù)發(fā)現(xiàn)了乳腺癌的14個變種,如今Ayasdi已經(jīng)在金融服務和醫(yī)療保健行業(yè)中獲得了相當數(shù)量的客戶。
可視化技術(shù),逐步實現(xiàn)了自動化、智能化
大數(shù)據(jù)可視化是連接數(shù)據(jù)分析結(jié)果與人腦的最好途徑,因此可視化技術(shù)的高低也成為了左右大數(shù)據(jù)企業(yè)獲客能力的重要因素。目前可視化的發(fā)展方向同大數(shù)據(jù)分析一致,都是朝著簡單、自動化、智能的方向在努力。
典型企業(yè)如Alteryx是一個提供一站式數(shù)據(jù)分析平臺的初創(chuàng)公司,旨在讓用戶在同一個平臺上完成數(shù)據(jù)輸入、建模以及數(shù)據(jù)圖形化等操作,將數(shù)據(jù)運算與精美的圖像完美地嫁接在一起,并能夠和SAS和R語言一樣進行數(shù)據(jù)的統(tǒng)計和分析。
通過可視化幫助用戶實現(xiàn)真正的管理能力提升也是重要的功能之一,德國大數(shù)據(jù)公司Celonis通過流程挖掘技術(shù),從日常記錄中提取數(shù)據(jù)、發(fā)現(xiàn)關(guān)鍵因素,并最終揭示公司在業(yè)務中的執(zhí)行情況,能夠幫助客戶公司提高30%的工作效率。
發(fā)展到如今,可視化技術(shù)已經(jīng)不局限于傳統(tǒng)的分析結(jié)果展示,而是能夠直接轉(zhuǎn)換文本、圖片等非結(jié)構(gòu)化的數(shù)據(jù)并直觀展現(xiàn),例如Quid利用機器智能讀取大量文本,然后將該數(shù)據(jù)轉(zhuǎn)換為交互式視覺地圖,以節(jié)約過去通常會耗費在閱讀檢索中的大量時間。Origami幫助營銷人員將CRM、社交媒體、郵件營銷和調(diào)查報告等跨平臺的數(shù)據(jù)整合并進行有效分析,使其簡單化、直觀化、視覺化,人人都能夠高效實用。
同時數(shù)據(jù)分析及可視化對硬件應用的革新也在進行中,開發(fā)GPU關(guān)系數(shù)據(jù)庫服務的Kinetica獲得了5000萬美元A輪融資,采用同一技術(shù)路線的MapD也已經(jīng)能夠做到比傳統(tǒng)計算內(nèi)核快100倍的速度對大數(shù)據(jù)進行查詢與可視化。
BI技術(shù)擺脫"雞肋",實時便捷普惠政企效率提升
BI技術(shù)的發(fā)展已經(jīng)有了較長的歷史,但由于技術(shù)因素此前一直被限制于企業(yè)內(nèi)部采集與應用,實際發(fā)揮的效果有限并且使用率不高。如今在數(shù)據(jù)采集與應用范圍普及與大數(shù)據(jù)分析、可視化技術(shù)的推動下,通過數(shù)據(jù)儀表板、智能決策等方式提升企業(yè)運營效率利器的BI再次獲得了資本市場的青睞,Tableau作為BI的代表性企業(yè)已經(jīng)順利IPO目前市值超過48億美元,另一家代表性企業(yè)DOMO估值也達到20億美元,成長速度遠超傳統(tǒng)商業(yè)軟件公司。
相比于可視化技術(shù),BI更偏重于實際的應用,通過模板化、SaaS化及去代碼等方式,BI應用范圍不再局限于數(shù)據(jù)科學家及企業(yè)高管,可預見未來企業(yè)內(nèi)部每個員工都可以通過BI工具獲知自己及所處部門的各項數(shù)據(jù),并能夠有針對性的改進工作方式與方向。
已經(jīng)累計融資1.77億美元的Looker令用戶能夠使用自然語言進行查詢,降低了查詢大型數(shù)據(jù)集的門檻;GoodData為企業(yè)提供大數(shù)據(jù)分析SaaS服務,其所有的數(shù)據(jù)分析服務實現(xiàn)了100%云化,企業(yè)可以將公司已有數(shù)據(jù)導入GoodData的云平臺,再對數(shù)據(jù)做跟蹤、切分、可視化、分析等處理。
BI領(lǐng)域一個有意思的應用案例是Qlik公司的產(chǎn)品受到了中國海關(guān)總署的高度贊揚。海關(guān)總署每天都需要進行龐大的數(shù)據(jù)分析, Qlik則通過圖形化數(shù)據(jù)展示,使海關(guān)管理人員不再受平臺和時間的限制,能夠多視角長跨度的分析,實現(xiàn)了對于現(xiàn)有海量數(shù)據(jù)的業(yè)務的快速展示,極大地促進了稽查效果。
“企業(yè)大數(shù)據(jù)檢索、產(chǎn)品大數(shù)據(jù)分析、大數(shù)據(jù)咨詢預測、大數(shù)據(jù)平臺及機器學習領(lǐng)域
企業(yè)大數(shù)據(jù)檢索能夠充分挖掘并釋放企業(yè)數(shù)據(jù)的潛力;產(chǎn)品的大數(shù)據(jù)分析使用戶行為成為了產(chǎn)品設計與運營環(huán)節(jié)的重要參考因素;大數(shù)據(jù)技術(shù)與咨詢業(yè)務的結(jié)合則對咨詢行業(yè)形成了很大的影響,數(shù)據(jù)技術(shù)導向的咨詢業(yè)務將極有可能成為未來行業(yè)的主流選擇;大數(shù)據(jù)服務支撐平臺類企業(yè)則為大數(shù)據(jù)技術(shù)的普及和實用化做了很大的貢獻,是大數(shù)據(jù)技術(shù)生態(tài)中不可或缺的一環(huán);最后是機器學習,作為大數(shù)據(jù)分析的底層技術(shù)方法也逐漸開始得到廣泛應用。
首先將企業(yè)大數(shù)據(jù)檢索、產(chǎn)品大數(shù)據(jù)分析、大數(shù)據(jù)咨詢預測、大數(shù)據(jù)平臺和機器學習這五個領(lǐng)域的典型企業(yè)列舉如下,接下來將分版塊進行詳細介紹。
企業(yè)大數(shù)據(jù)檢索
移動互聯(lián)網(wǎng)的普及與SaaS服務的興起令企業(yè)沉淀的數(shù)據(jù)量呈指數(shù)級上升,但目前對企業(yè)數(shù)據(jù)價值的挖掘僅僅停留在較淺層面,真正的大數(shù)據(jù)分析能力還尚未應用。因此如何做好企業(yè)內(nèi)部數(shù)據(jù)信息價值的發(fā)掘成為了關(guān)鍵的第一步。
提升企業(yè)數(shù)據(jù)挖掘檢索能力,并將檢索的技術(shù)門檻降低的典型企業(yè)有Algolia,目前其產(chǎn)品具備關(guān)鍵字輸入智能容錯功能,并提供搜索排名配置,能夠讓普通員工也能按需要找到自己所需的數(shù)據(jù)信息。同時Algolia還為移動設備提供了離線搜索引擎,其C++ SDK可以嵌入到應用服務器端,這樣即便沒有網(wǎng)絡連接應用也能提供搜索功能,適用范圍很廣。
而在SaaS化服務興起的同時,企業(yè)采用多種軟件導致內(nèi)部數(shù)據(jù)不聯(lián)通而形成了數(shù)據(jù)孤島。根據(jù)互聯(lián)網(wǎng)女皇Mary Meeker的分析,不同行業(yè)的公司平均使用SaaS服務的數(shù)量從最低25個至高達91個,需要跨平臺數(shù)據(jù)檢索分析服務。Maana開發(fā)的數(shù)據(jù)搜索和發(fā)現(xiàn)平臺Maana Knowledge Graph,其長處便是收集來自多個系統(tǒng)或者”孤島”的數(shù)據(jù),并將其轉(zhuǎn)換為運營建議,可廣泛應用于多個行業(yè)。
產(chǎn)品大數(shù)據(jù)分析
產(chǎn)品大數(shù)據(jù)分析相對其他應用來說關(guān)注度稍低,但其能夠發(fā)揮的功能并不少。通過收集用戶的瀏覽、點擊、購買等行為,不單從宏觀上能夠察覺用戶群體的喜好變化提前應對,微觀上還能夠構(gòu)建用戶畫像,從而做到定制的產(chǎn)品推薦與營銷,能夠有效的提升用戶的消費水平與滿意程度。
Mixpanel便是一家提供類似產(chǎn)品的公司,其讓企業(yè)用戶跟蹤用戶的使用習慣提供實時分析,其產(chǎn)品有用戶動態(tài)分析(Trends)、行為漏斗模型(Funnels)、用戶活躍度(Cohorts)及單用戶行為分析(People)等幾個模塊,全面的覆蓋了可能發(fā)生的用戶行為與場景。
大數(shù)據(jù)咨詢預測
如今大數(shù)據(jù)技術(shù)的發(fā)展為事件分析和預測提供了可能,并且準確度和處理速度已經(jīng)具備了很大競爭力,傳統(tǒng)咨詢公司的處境類似于現(xiàn)在面對AI威脅的華爾街分析師,或許不久之后就將會被替代。因此隨著逐漸出現(xiàn)大數(shù)據(jù)咨詢公司的同時,傳統(tǒng)咨詢企業(yè)也紛紛與大數(shù)據(jù)技術(shù)公司合作,甚至成立了自己的數(shù)據(jù)業(yè)務部門。
Opera Solutions便是一家依托大數(shù)據(jù)分析的咨詢公司,其創(chuàng)始人是咨詢行業(yè)資深人士,曾創(chuàng)辦了商業(yè)咨詢公司Mitchell Madison和Zeborg。
目前Opera致力于金融領(lǐng)域的數(shù)據(jù)分析類咨詢,通過建模、定量分析給客戶提供建議,解決客戶的商業(yè)問題。例如其計算機系統(tǒng)可以一次性采集數(shù)十億條數(shù)據(jù),包含從房產(chǎn)和汽車價格到經(jīng)紀賬戶和供應鏈的實時數(shù)據(jù)等,通過分析從中獲得有關(guān)消費者、市場和整個經(jīng)濟體系將如何行動的信號或見解。其客戶包含了咨詢機構(gòu)及花旗銀行等公司,最近還為摩根士丹利提供了幫助經(jīng)紀人團隊給其客戶提供投資建議的業(yè)務。
新技術(shù)、機器學習與咨詢預測行業(yè)的結(jié)合,相比于僅使用大數(shù)據(jù)分析技術(shù)能夠獲得更好的效果,也成為了行業(yè)內(nèi)的一個小熱點。例如基于社會物理學原理的Endor能夠依托少量數(shù)據(jù)生成統(tǒng)一的人類行為數(shù)據(jù)集,并比傳統(tǒng)海量數(shù)據(jù)分析方式更早的做出模式識別與判斷。在甄別facebook上受ISIS控制的賬號的實驗中,根據(jù)已知少量ISIS賬號特性,Endor高效分辨出了新的ISIS疑似賬號并且準確度令人滿意。
大數(shù)據(jù)服務支撐平臺
目前圍繞著大數(shù)據(jù)技術(shù)與大數(shù)據(jù)產(chǎn)業(yè)生態(tài)鏈發(fā)展的,還有許多是平臺服務型的公司,這類公司具備一定的技術(shù)水平,但主要通過服務大數(shù)據(jù)技術(shù)公司及科研人員而存在,是技術(shù)生態(tài)中不可或缺的一環(huán)。
Dataiku創(chuàng)建了一個云平臺,旨在使數(shù)據(jù)科學家和普通員工更容易獲得公司收集的大數(shù)據(jù),并通過機器學習庫縮短了專家以及數(shù)據(jù)分析師所需要的時間。
Algorithmia的平臺上提供包括機器學習、語義分析、文本分析等通用性算法,一旦用戶找到想用的算法,只需添加幾行簡單的算法查詢代碼到應用中,Algorithmia的服務器就會與應用連接,避免了開發(fā)者的重復勞動。
目前部分向開發(fā)者社區(qū)業(yè)務發(fā)展過渡的平臺型企業(yè),因其資源已經(jīng)得到行業(yè)巨頭的青睞,被Google收購的Kaggle便是一例,通過舉辦數(shù)據(jù)科學周邊的線上競賽,Kaggle吸引了大量數(shù)據(jù)科學家、機器學習開發(fā)者的參與,為各類現(xiàn)實中的商業(yè)難題尋找基于數(shù)據(jù)的算法解決方案。同時Kaggle為其社區(qū)提供了一整套服務,包括知名的招聘服務以及代碼分享工具Kernels。
機器學習
機器學習,是模式識別、統(tǒng)計學習、數(shù)據(jù)挖掘的技術(shù)手段,也是計算機視覺、語音識別、自然語言處理等領(lǐng)域的底層技術(shù),在附件的介紹中大家可以看到,微軟Azure、Google云平臺及AWS都推出了自己的機器學習產(chǎn)品,而眾多的機器學習創(chuàng)業(yè)公司則通過提供有特色的技術(shù)或服務進行差異化競爭。
已累計獲得了7900萬美元融資的Attivio專注于利用機器學習技術(shù)通過文本進行情緒分析,提供有監(jiān)督的機器學習與無監(jiān)督機器學習兩種技術(shù),幫助企業(yè)通過識別企業(yè)語料庫中的文檔進行情緒建模與分析。思科通過Attivio的智能系統(tǒng)令銷售人員能夠在與客戶合作時依據(jù)對方的情緒、消費能力等數(shù)據(jù)推薦合適產(chǎn)品,從而節(jié)省了數(shù)百萬的銷售運營費用,同時節(jié)約了銷售團隊15-25%的時間。
DataRobot的業(yè)務是搜索了數(shù)百萬種可能的算法組合,并進行預處理、特征計算、轉(zhuǎn)換和調(diào)整參數(shù),為用戶的數(shù)據(jù)集和預測目標提供最佳模型,使用戶無需數(shù)據(jù)科學專業(yè)背景也能在幾分鐘內(nèi)構(gòu)建優(yōu)秀模型,例如銀行利用Datarobot能夠自動構(gòu)建非常準確的預測模型,識別欺詐性金融交易從而避免損失。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8882瀏覽量
137394
原文標題:2017全球大數(shù)據(jù)產(chǎn)業(yè)八領(lǐng)域典型公司盤點分析
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論