mysqlhadoop实时同步_MySQL数据复制Hadoop实时复制MySQL复制操作可以将数据从⼀个MySQL服务器(主)复制到其他的⼀个或多个MySQL服务器(从)。试想⼀下,如果从服务器不再局限为⼀个MySQL服务器,⽽是其他任何数据库服务器或平台,并且复制事件要求实时进⾏,是否可以实现呢?中国十大名校
MySQL团队最新推出的 MySQL Applier for Hadoop(以下简称Hadoop Applier)旨在解决这⼀问题。
⽤途
例如,复制事件中的从服务器可能是⼀个数据仓库系统,如Apache Hive,它使⽤Hadoop分布式⽂件系统(HDFS)作为数据存储区。如果你有⼀个与HDFS相关的Hive元存储,Hadoop Applier就可以实时填充Hive数据表。数据是从MySQL中以⽂本⽂件形式导出到HDFS,然后再填充到Hive。
操作很简单,只需在Hive运⾏HiveQL语句'CREATE TABLE',定义表的结构与MySQL相似,然后运⾏Hadoop Applier即可开始实时复制数据。ps如何换背景
辞职报告书优势
如何压缩文件在Hadoop Applier之前,还没有任何⼯具可以执⾏实时传输。之前的解决⽅案是通过Apache Sqoop导出数据到HDFS,尽管可以批量传输,但是需要经常将结果重复导⼊以保持数据更新。在进⾏⼤量数据传输时,其他查询会变得很慢。且在数据库较⼤的情况下,如果只进⾏了⼀点更改,Sqoop可能也需要较
长时间来加载。
⽽Hadoop Applier则会读取⼆进制⽇志,只应⽤MySQL服务器上发⽣的事件,并插⼊数据,不需要批量传输,操作更快,因此并不影响其他查询的执⾏速度。
实现
会计凭证封面中秋祝福语句Applier使⽤⼀个由libhdfs(⽤于操作HDFS中⽂件的C库)提供的API。实时导⼊的过程如下图所⽰:
数据库被映射作为⼀个单独的⽬录,它们的表被映射作为⼦⽬录和⼀个Hive数据仓库⽬录。插⼊到每个表中的数据被写⼊⽂本⽂件(命名如),数据以逗号或其他符号分割(可通过命令⾏进⾏配置)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论