資料介紹
軟件簡介
seatunnel 是一個非常易用的支持海量數(shù)據(jù)實時同步的超高性能分布式數(shù)據(jù)集成平臺,每天可以穩(wěn)定高效同步數(shù)百億數(shù)據(jù),已在近百家公司生產(chǎn)上使用。
為什么我們需要 seatunnel
seatunnel 盡所能為您解決海量數(shù)據(jù)同步中可能遇到的問題:
- 數(shù)據(jù)丟失與重復(fù)
- 任務(wù)堆積與延遲
- 吞吐量低
- 應(yīng)用到生產(chǎn)環(huán)境周期長
- 缺少應(yīng)用運行狀態(tài)監(jiān)控
seatunnel 使用場景
- 海量數(shù)據(jù)同步
- 海量數(shù)據(jù)集成
- 海量數(shù)據(jù)的 ETL
- 海量數(shù)據(jù)聚合
- 多源數(shù)據(jù)處理
seatunnel 的特性
- 簡單易用,靈活配置,無需開發(fā)
- 實時流式處理
- 離線多源數(shù)據(jù)分析
- 高性能、海量數(shù)據(jù)處理能力
- 模塊化和插件化,易于擴(kuò)展
- 支持利用 SQL 做數(shù)據(jù)處理和聚合
- 支持 Spark Structured Streaming
- 支持 Spark 2.x
seatunnel 的工作流程
Input[數(shù)據(jù)源輸入] -> Filter[數(shù)據(jù)處理] -> Output[結(jié)果輸出]
多個 Filter 構(gòu)建了數(shù)據(jù)處理的 Pipeline,滿足各種各樣的數(shù)據(jù)處理需求,如果您熟悉 SQL,也可以直接通過 SQL 構(gòu)建數(shù)據(jù)處理的 Pipeline,簡單高效。目前 seatunnel 支持的Filter列表, 仍然在不斷擴(kuò)充中。您也可以開發(fā)自己的數(shù)據(jù)處理插件,整個系統(tǒng)是易于擴(kuò)展的。
seatunnel 支持的插件
- Input plugin
Fake, File, Hdfs, Kafka, S3, Socket, 自行開發(fā)的 Input plugin
- Filter plugin
Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自行開發(fā)的Filter plugin
- Output plugin
Elasticsearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout, 自行開發(fā)的 Output plugin
環(huán)境依賴
-
java 運行環(huán)境,java >= 8
-
如果您要在集群環(huán)境中運行 seatunnel,那么需要以下 Spark 集群環(huán)境的任意一種:
- Spark on Yarn
- Spark Standalone
如果您的數(shù)據(jù)量較小或者只是做功能驗證,也可以僅使用?local
?模式啟動,無需集群環(huán)境,seatunnel 支持單機(jī)運行。 注: seatunnel 2.0 支持 Spark 和 Flink 上運行
下載
可以直接運行的軟件包下載地址:https://github.com/InterestingLab/seatunnel/releases
快速入門
快速入門:https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/quick-start
關(guān)于 seatunnel 的詳細(xì)文檔
生產(chǎn)應(yīng)用案例
-
微博, 增值業(yè)務(wù)部數(shù)據(jù)平臺 微博某業(yè)務(wù)有數(shù)百個實時流式計算任務(wù)使用內(nèi)部定制版 seatunnel,以及其子項目Guardian做 seatunnel On Yarn 的任務(wù)監(jiān)控。
-
新浪, 大數(shù)據(jù)運維分析平臺 新浪運維數(shù)據(jù)分析平臺使用 seatunnel 為新浪新聞,CDN 等服務(wù)做運維大數(shù)據(jù)的實時和離線分析,并寫入 Clickhouse。
-
搜狗,搜狗奇點系統(tǒng) 搜狗奇點系統(tǒng)使用 seatunnel 作為 ETL 工具, 幫助建立實時數(shù)倉體系
-
趣頭條,趣頭條數(shù)據(jù)中心 趣頭條數(shù)據(jù)中心,使用 seatunnel 支撐 mysql to hive 的離線 ETL 任務(wù)、實時 hive to clickhouse 的 backfill 技術(shù)支撐,很好的 cover 離線、實時大部分任務(wù)場景。
-
永輝超市子公司-永輝云創(chuàng),會員電商數(shù)據(jù)分析平臺 seatunnel 為永輝云創(chuàng)旗下新零售品牌永輝生活提供電商用戶行為數(shù)據(jù)實時流式與離線 SQL 計算。
-
水滴籌, 數(shù)據(jù)平臺 水滴籌在 Yarn 上使用 seatunnel 做實時流式以及定時的離線批處理,每天處理 3~4T 的數(shù)據(jù)量,最終將數(shù)據(jù)寫入 Clickhouse。
更多案例參見:?https://interestinglab.github.io/seatunnel-docs/#/zh-cn/v1/case_study/
貢獻(xiàn)觀點和代碼
提交問題和建議:https://github.com/InterestingLab/seatunnel/issues
貢獻(xiàn)代碼:https://github.com/InterestingLab/seatunnel/pulls
開發(fā)者
- 基于DSP的航空發(fā)動機(jī)分布式總線設(shè)計方案 14次下載
- 虛擬化模型驅(qū)動的分布式數(shù)據(jù)湖架構(gòu)設(shè)計 5次下載
- Ceph分布式存儲系統(tǒng)性能優(yōu)化研究綜述 5次下載
- 基于分布式數(shù)據(jù)Cache的實時動態(tài)遷移機(jī)制 20次下載
- 區(qū)塊鏈中的分布式數(shù)據(jù)庫管理系統(tǒng)相關(guān)研究 8次下載
- 基于分布式文件系統(tǒng)元數(shù)據(jù)操作優(yōu)化 0次下載
- 一種面向高性能計算的分布式對象存儲系統(tǒng) 0次下載
- 分布式數(shù)據(jù)流上的高性能分發(fā)策略 0次下載
- 基于高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng) 1次下載
- 分布式云管理協(xié)同平臺研究 6次下載
- Windows平臺的分布式實時仿真系統(tǒng) 10次下載
- 基于Windows平臺的分布式實時仿真系統(tǒng)
- 無線分布式集成監(jiān)測網(wǎng)絡(luò)系統(tǒng)及應(yīng)用
- 分布式制造資源集成系統(tǒng)軟件平臺研究
- 無線分布式集成監(jiān)測網(wǎng)絡(luò)系統(tǒng)及應(yīng)用
- Java手寫分布式鎖的實現(xiàn) 424次閱讀
- tldb提供分布式鎖使用方法 761次閱讀
- 數(shù)據(jù)庫如何實現(xiàn)分布式鎖 4438次閱讀
- 深入理解redis分布式鎖 763次閱讀
- Apache Pulsar的特性 607次閱讀
- 分布式存儲架構(gòu)面臨的挑戰(zhàn) 1288次閱讀
- 如何使用分布式存儲系統(tǒng)促進(jìn)AI模型訓(xùn)練 494次閱讀
- 鴻蒙分布式相機(jī)“踩坑”分享 1578次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應(yīng)用 8424次閱讀
- 分布式控制系統(tǒng)的介紹 5216次閱讀
- 分布式工業(yè)物聯(lián)網(wǎng)云平臺是怎樣的 1694次閱讀
- Redis 分布式鎖的正確實現(xiàn)方式 3483次閱讀
- Apache Ignite上的TensorFlow!分布式內(nèi)存數(shù)據(jù)源 3618次閱讀
- 淺談分布式塊存儲的元數(shù)據(jù)服務(wù)設(shè)計 4871次閱讀
- 深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng) 1773次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多