RM新时代网站-首页

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>Apache SeaTunnel高性能分布式數(shù)據(jù)集成平臺

Apache SeaTunnel高性能分布式數(shù)據(jù)集成平臺

2022-06-14 | zip | 0.58 MB | 次下載 | 2積分

資料介紹

授權(quán)協(xié)議 Apache
開發(fā)語言 Java
軟件類型 開源軟件

軟件簡介

seatunnel 是一個非常易用的支持海量數(shù)據(jù)實時同步的超高性能分布式數(shù)據(jù)集成平臺,每天可以穩(wěn)定高效同步數(shù)百億數(shù)據(jù),已在近百家公司生產(chǎn)上使用。

為什么我們需要 seatunnel

seatunnel 盡所能為您解決海量數(shù)據(jù)同步中可能遇到的問題:

  • 數(shù)據(jù)丟失與重復(fù)
  • 任務(wù)堆積與延遲
  • 吞吐量低
  • 應(yīng)用到生產(chǎn)環(huán)境周期長
  • 缺少應(yīng)用運行狀態(tài)監(jiān)控

seatunnel 使用場景

  • 海量數(shù)據(jù)同步
  • 海量數(shù)據(jù)集成
  • 海量數(shù)據(jù)的 ETL
  • 海量數(shù)據(jù)聚合
  • 多源數(shù)據(jù)處理

seatunnel 的特性

  • 簡單易用,靈活配置,無需開發(fā)
  • 實時流式處理
  • 離線多源數(shù)據(jù)分析
  • 高性能、海量數(shù)據(jù)處理能力
  • 模塊化和插件化,易于擴(kuò)展
  • 支持利用 SQL 做數(shù)據(jù)處理和聚合
  • 支持 Spark Structured Streaming
  • 支持 Spark 2.x

seatunnel 的工作流程

pYYBAGKjJIqACBxRAABXRzrh5fs073.png

                         Input[數(shù)據(jù)源輸入] -> Filter[數(shù)據(jù)處理] -> Output[結(jié)果輸出]

多個 Filter 構(gòu)建了數(shù)據(jù)處理的 Pipeline,滿足各種各樣的數(shù)據(jù)處理需求,如果您熟悉 SQL,也可以直接通過 SQL 構(gòu)建數(shù)據(jù)處理的 Pipeline,簡單高效。目前 seatunnel 支持的Filter列表, 仍然在不斷擴(kuò)充中。您也可以開發(fā)自己的數(shù)據(jù)處理插件,整個系統(tǒng)是易于擴(kuò)展的。

seatunnel 支持的插件

  • Input plugin

Fake, File, Hdfs, Kafka, S3, Socket, 自行開發(fā)的 Input plugin

  • Filter plugin

Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自行開發(fā)的Filter plugin

  • Output plugin

Elasticsearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout, 自行開發(fā)的 Output plugin

環(huán)境依賴

  1. java 運行環(huán)境,java >= 8

  2. 如果您要在集群環(huán)境中運行 seatunnel,那么需要以下 Spark 集群環(huán)境的任意一種:

  • Spark on Yarn
  • Spark Standalone

如果您的數(shù)據(jù)量較小或者只是做功能驗證,也可以僅使用?local?模式啟動,無需集群環(huán)境,seatunnel 支持單機(jī)運行。 注: seatunnel 2.0 支持 Spark 和 Flink 上運行

下載

可以直接運行的軟件包下載地址:https://github.com/InterestingLab/seatunnel/releases

快速入門

快速入門:https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/quick-start

關(guān)于 seatunnel 的詳細(xì)文檔

生產(chǎn)應(yīng)用案例

  • 微博, 增值業(yè)務(wù)部數(shù)據(jù)平臺 微博某業(yè)務(wù)有數(shù)百個實時流式計算任務(wù)使用內(nèi)部定制版 seatunnel,以及其子項目Guardian做 seatunnel On Yarn 的任務(wù)監(jiān)控。

  • 新浪, 大數(shù)據(jù)運維分析平臺 新浪運維數(shù)據(jù)分析平臺使用 seatunnel 為新浪新聞,CDN 等服務(wù)做運維大數(shù)據(jù)的實時和離線分析,并寫入 Clickhouse。

  • 搜狗,搜狗奇點系統(tǒng) 搜狗奇點系統(tǒng)使用 seatunnel 作為 ETL 工具, 幫助建立實時數(shù)倉體系

  • 趣頭條,趣頭條數(shù)據(jù)中心 趣頭條數(shù)據(jù)中心,使用 seatunnel 支撐 mysql to hive 的離線 ETL 任務(wù)、實時 hive to clickhouse 的 backfill 技術(shù)支撐,很好的 cover 離線、實時大部分任務(wù)場景。

  • 一下科技, 一直播數(shù)據(jù)平臺

  • 永輝超市子公司-永輝云創(chuàng),會員電商數(shù)據(jù)分析平臺 seatunnel 為永輝云創(chuàng)旗下新零售品牌永輝生活提供電商用戶行為數(shù)據(jù)實時流式與離線 SQL 計算。

  • 水滴籌, 數(shù)據(jù)平臺 水滴籌在 Yarn 上使用 seatunnel 做實時流式以及定時的離線批處理,每天處理 3~4T 的數(shù)據(jù)量,最終將數(shù)據(jù)寫入 Clickhouse。

更多案例參見:?https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/case_study/

貢獻(xiàn)觀點和代碼

提交問題和建議:https://github.com/InterestingLab/seatunnel/issues

貢獻(xiàn)代碼:https://github.com/InterestingLab/seatunnel/pulls

開發(fā)者

感謝所有開發(fā)者

?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應(yīng)用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關(guān)電源設(shè)計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設(shè)計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費
RM新时代网站-首页