datax实现mysql增量同步_DataX数据全量,增量同步⽅案关于DataX 增量更新实现
增量更新总体思路:从⽬标数据库读取⼀个最⼤值的记录,可以是DataTime 或者 RowVersion 类型,然后根据这个最⼤值对源数据库要同步的表进⾏过滤,然后再进⾏同步即可。
公司注册流程及费用由于DataX ⽀持多种数据库的读写,⼀种相对简单并且可靠的思路就是:
从csv ⽂件读取⽬标数据库上次抽取数据的⼀个最⼤值;
动态修改json配置⽂件(增加过滤条件);
执⾏修改后的配置⽂件,进⾏增量同步;必须去的景点
同步成功,将系统当前时间写⼊csv⽂件;
接下来就是shell 脚本来⼀步⼀步实现增量更新
增量更新shell 实现
车管所上班时间图⽰如下:
dataX增量更新⽅案.png
我们的同步环境是从oracle 到 hive,由于dataX ⽆法从⽬的数据库(即hive)中读取值,因此改为从csv⽂件读取,
同样因为⽆法读取hive数据库内最⼤值,因此最⼤值,采⽤上次数据同步时间。我们要做的只是每次数据同步成功后把系统时间写⼊到对应的csv⽂件中(每个表对应⼀个csv⽂件)。
1. 数据同步json 配置⽂件
从oracle 同步到hive ,部分配置如下黑星期天的歌词
例: oracle2hive_ods_s_jy_AB01.json
我就在这里等你跨山越海踏着云烟来{
湿地中国"job"
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论