成為數(shù)據(jù)工程師需要具備哪些技能?數(shù)據(jù)工程工作存在于各個(gè)行業(yè),在銀行業(yè)、醫(yī)療保健業(yè)、大型科技企業(yè)、初創(chuàng)企業(yè)和其他行業(yè)找到工作機(jī)會(huì)。許多職位描述要求數(shù)據(jù)工程師、擁有數(shù)學(xué)或工程學(xué)位,但如果有合適的經(jīng)驗(yàn)學(xué)位往往沒那么重要。
那么如何獲得數(shù)據(jù)開發(fā)相關(guān)崗位的工作經(jīng)驗(yàn)?如果是應(yīng)屆畢業(yè)生爭取獲得一個(gè)數(shù)據(jù)工程師的實(shí)習(xí)機(jī)會(huì)。門檻最低雇主們?cè)敢庹乙粋€(gè)沒有工作經(jīng)驗(yàn)的人;另一種是側(cè)面獲得該職位,即使你沒有計(jì)算機(jī)科學(xué)或數(shù)學(xué)背景,仍然可以通過獲得分析師或項(xiàng)目經(jīng)理的職位進(jìn)入數(shù)據(jù)工程領(lǐng)域,開始著手越來越多的數(shù)據(jù)工程領(lǐng)域的工作。不僅需要做自己份內(nèi)的工作,也要做一些額外的數(shù)據(jù)工程工作,試著爭取與數(shù)據(jù)工程師非常接近的職位,如數(shù)據(jù)分析師。
數(shù)據(jù)工程師應(yīng)具備哪些技能?高水平的數(shù)據(jù)工程師將數(shù)據(jù)從A點(diǎn)傳輸?shù)紹點(diǎn),并將其重新構(gòu)建為分析師和數(shù)據(jù)科學(xué)家可以輕松使用的格式。從技能的角度來看,數(shù)據(jù)工程師需要ETLs(提取、轉(zhuǎn)換、加載)、自動(dòng)化(通常使用Python或其他編程語言)、數(shù)據(jù)建模或者數(shù)據(jù)倉庫、SQL和NoSQL數(shù)據(jù)操作以及數(shù)據(jù)可視化等專業(yè)技能。ETLs和數(shù)據(jù)倉庫是一種新技能,在獲得學(xué)士學(xué)位后,會(huì)在碩士或證書課程中得到更多的涉獵。
數(shù)據(jù)工程師應(yīng)該能夠熟練的使用各種工具,從編程語言到拖放工具,從云數(shù)據(jù)倉庫到數(shù)據(jù)可視化程序??晒?shù)據(jù)工程師使用的工具比一個(gè)人一生可能掌握的工具要多得多。如數(shù)據(jù)工程工具包括SSIS、Azuredata Factory、Tableau、Informatica、Matillion、Fivetran、Snowflake、Redshift和Databricks等。大數(shù)據(jù)工程師的技術(shù)要求如下:
1、掌握至少一種數(shù)據(jù)庫開發(fā)技術(shù):Oracle、Teradata、DB2、Mysql等,靈活運(yùn)用SQL實(shí)現(xiàn)海量數(shù)據(jù)ETL加工處理;
2、熟悉Linux系統(tǒng)常規(guī)shell處理命令,靈活運(yùn)用shell做的文本處理和系統(tǒng)操作;
3、有從事分布式數(shù)據(jù)存儲(chǔ)與計(jì)算平臺(tái)應(yīng)用開發(fā)經(jīng)驗(yàn),熟悉Hadoop生態(tài)相關(guān)技術(shù)并有相關(guān)實(shí)踐經(jīng)驗(yàn)著優(yōu)先,重點(diǎn)考察Hdfs、Mapreduce、Hive、Hbase;
4、熟練掌握一門或多門編程語言,并有大型項(xiàng)目建設(shè)經(jīng)驗(yàn)者優(yōu)先,重點(diǎn)考察Java、Python、Perl;
5、熟悉數(shù)據(jù)倉庫領(lǐng)域知識(shí)和技能者優(yōu)先,包括但不局限于:元數(shù)據(jù)管理、數(shù)據(jù)開發(fā)測試工具與方法、數(shù)據(jù)質(zhì)量、主數(shù)據(jù)管理;
6、掌握實(shí)時(shí)流計(jì)算技術(shù),有storm開發(fā)經(jīng)驗(yàn)者優(yōu)先。
數(shù)據(jù)工程師的目標(biāo)著眼于全局和開發(fā)。數(shù)據(jù)工程師建立自動(dòng)化系統(tǒng)和模型數(shù)據(jù)結(jié)構(gòu)以使數(shù)據(jù)得到有效處理。數(shù)據(jù)工程師的目標(biāo)是創(chuàng)建及開發(fā)表和數(shù)據(jù)管道,以支持分析儀表板和其他數(shù)據(jù)客戶(如數(shù)據(jù)科學(xué)家、分析師和其他工程師)。與大多數(shù)工程師很相似,有很多設(shè)計(jì)、假設(shè)、限制和開發(fā),能夠創(chuàng)建某種最終的強(qiáng)健系統(tǒng)。這個(gè)系統(tǒng)可能是一個(gè)數(shù)據(jù)倉庫和ETL或者流式管道。
大數(shù)據(jù)學(xué)習(xí)潮流已成必然,“超高薪、高大上、前景光明”成為大數(shù)據(jù)行業(yè)的代名詞。隨著數(shù)據(jù)開發(fā)工程師成為炙手可熱的職位,與之相關(guān)各項(xiàng)條件水漲船高:錄取標(biāo)準(zhǔn)、人才需求、以及,薪資待遇,因此想要學(xué)習(xí)大數(shù)據(jù)掌握相關(guān)技能才是自身最大的核心競爭力。
責(zé)編AJX
-
Linux
+關(guān)注
關(guān)注
87文章
11292瀏覽量
209317 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1445瀏覽量
34047 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8882瀏覽量
137392
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論