栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Flink-cdc所带来的问题

Flink-cdc所带来的问题


标题: Flink-cdc所带来的问题
日期: 2021-11-28 22:45:09
标签: [flink,flink-cdc]
分类: Flink

今天说下flink-cdc吧,最近工作中遇到了一个比较棘手的问题。

我们都知道flink对比其他流计算引擎,其中一个优势就是cdc,它能够作为各个数据源的source和sink,实时接入和实时推送数据,为我们解决了实时接入和推送的问题。

工作中用到了flink mysql-cdc,实时导入mysql数据的增删改,你需要做的就是简单配置一个sql,即可搞定,看下面:

-- 在Flink创建订单实收source表
CREATE TABLE order_info (
  orderCode STRING,
  serviceCode STRING,
  accountPeriod STRING,
  subjectName STRING ,
  subjectCode STRING,
  occurDate TIMESTAMP,
  amt  DECIMAL(11, 2),
  status STRING,
  proc_time AS PROCTIME()  -–使用维表时需要指定该字段
) WITH (
  'connector' = 'mysql-cdc',
  'hostname' = '******',
  'port' = '3307',
  'username' = '******',
  'password' = '******',
  'database-name' = 'cdc',
  'table-name' = '***',
);

是不是很简单。

一般,如果我们要实时接入mysql的增删改数据,到kafka,通过canal、debezium、maxwell等工具实现,你要做的就是搭一套相应的工作环境,才能顺利到达kafka。

现在我碰到的一个问题是,flink-cdc接入mysql数据,开通了mysql的binlog,当flink去读取binlog之前,会先lock对应mysql实例中的所有库表,不让其他客户端连接做dml操作。
当读完了binlog之后,会释放该锁,其他程序可以正常dml操作了,然后继续锁表,不停循环。

这里有问题的就是,在锁表期间,其他所有表也均不能做dml操作,这时,如果有程序需要做dml操作时,会等待flink-cdc释放全局锁,释放完之后,再进行dml操作。

所以flink-cdc会影响到其他程序的写动作,影响到了业务。

那么有什么解决办法呢?

分析原因,大概了解到,flink-cdc底层也是通过debezium实现的监控mysql binlog,实现实时获取增删改数据,那么该平台在同步binlog时,读取binlog确实需要锁住mysql,不然在读取的时候,还有日志写入binlog,导致读取混乱,所以全局锁是在所难免的。
那怎么办呢?

归其原因,就是业务库mysql和数据同步的对对应的mysql相同,导致在做数据同步的时候,会有影响,如果mysql不一样呢?业务库专门做业务,另一个mysql专门做数据同步,这个mysql作为业务库的slave不就行了?这样互不干扰。

或者大家有没有其他同步mysql增删改数据的方案呢?

欢迎留言。


齐家,治国,平天下。

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:

喜欢宠物的朋友可以关注:【电巴克宠物Pets】

一起学习,一起进步。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/613233.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号