7.3.2、FlinkX

大数据系统更新时间：2026-05-21 22:22:07 发布时间：1669天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

1、使用

基于flink架构来完成数据同步，数据量大的话比datax较快，分布式

2、数据源

支持多种数据源，以source（读）与sink（写）存在，支持实时数据库kafka等

3、运行任务模板—github上有

脚本文件：StreamToStream.json

{
  "job" : {
    "content" : [ {
      "reader" : {
        "parameter" : {
          "column" : [ {
            "name": "id",
            "type" : "id"
          }, {
            "name": "string",
            "type" : "string"
          } ],
          "sliceRecordCount" : [ "10"]
        },
        "name" : "streamreader"
      },
      "writer" : {
        "parameter" : {
          "print" : true
        },
        "name" : "streamwriter"
      }
    } ],
    "setting" : {
      "speed" : {
        "channel" : 1
      }
    }
  }
}

4、运行任务–脚本文件：StreamToStream.json

flinkx -mode local -job ./job/StreamToStream.json 
-flinkconf 
./ flinkconf/ 
-pluginRoot ./syncplugins/

5、监听日志

flinkx 任务启动后，会在执行命令的目录下生成一个nohup.out文件 tail -f nohup.out

6、通过web界面查看任务运行情况

http://master:8888

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/345505.html

上一篇 Mongod 基础知识 + 命令 + 配置文件

下一篇 Flink Yarn的2种任务提交方式

大数据系统相关栏目本月热门文章

关于我们文章归档网站地图联系我们