datax异构数据库数据迁移总结
全国二卷有哪些省 datax是开源的ETL⼯具,可根据需求⾃⼰做开发、实施和维护。⽀持多种数据库类型,可扩张性强,⼀张表的同步作业调起只需⼀⾏命令。笔者认为迁移的要点有⼆:①迁移⽬的表先建好,因datax做不了结构同步;②配置正确的json⽂件,⼀张表⼀个json⽂件。
datax跨数据库同步常遇到的问题包括:
lbp2900打印机驱动1、如何实现不同数据库的数据同步?
根据数据库类型,配置job中的reader、writer。官⽅⽀持多种数据库。每⼀张表的同步,需要配置⼀个json⽂件。需要⼿动创建⽬的表或者分区表。
纳米技术有哪些用途tcl冰箱2、如何指定数据同步⽅式,增量、全量?
官⽅⽂档writer模块中不同数据库的默认配置参数,有的数据库类型只有⼀种同步当时,有的必须指定WriteMode,postgrewriter只⽀持insert⽅式⼊库,mysql⽀持insert、replace⽅式写⼊,当⽬的表没有主键或者其他唯⼀约束时,insert、replace同步数据的结果是⼀样的。
手套3、如何提⾼同步效率?
调参,修改json⽂件中的 setting channel参数;针对⼤表的同步,可视实际需求和可⾏性做分区;
4、datax是否有事务控制
datax没有事务控制,但json中的⼀些配置参数能⽤起来。⽐如, jobsetting中的errorlimit,是对写⼊的脏数据的限制,⼀般设置为1,即⼀旦产⽣⼀条脏数据,便回滚此次写⼊。也可以利⽤起writer中的preSql、postSql。preSql即在写⼊数据前对⽬的表执⾏sql语句操
怎么拍人作,postSql即在写⼊数据后对⽬的表进⾏操作。⽐如,preSql设置,写⼊数据前清空⽬的表,postSql设置写⼊后如果记录数与源表对不上,或者时间戳字段没有更新,则清空本次作业中写⼊该⽬的表的数据等。
5、datax迁移要求⽬的数据库先有对应的表,如何批量在⽬的数据库建表?
datax是通过代码编写规则,可以⽤python的第三⽅库编写脚本,远程连接⽬的数据库批量建表,sqlalchemy、pymysql等第三⽅库都可以⽤起来。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论