kettle的资源库创建及修改密码
在kettle中的转换或者作业等资源的存储的仓库称为资源库:分为⽂件资源库、数据库资源库。
⼀个转换或者作业可以属于某个资源库或者⼀个单独的⽂件形态存在。
⼀、数据库资源库
横竖都是二1.1在mysql中创建⼀个数据库作为数据库资源库
1.2创建数据库资源库⼯具--》资源库--》连接资源库--》点击加号--》选择创建数据库资源库
因为我们要使⽤mysql作为资源库,所以kettle需要连接到mysql,也就是说需要mysql的驱动包,我们要把驱动包拷贝到kettle的lib⽬录下。
创建数据库连接并且通过测试
选择创建或更新
1.3创建完成后,验证数据库中是否创建了很多的表
看到这些表,就表⽰创建完成了⼀个数据库资源库了。
1.4创建⼀个转换,并且创建⼀个DB连接,验证这个不共享的DB连接能不能在资源库中共享
经过测试是可以的。
⼆、⽂件资源库
⼯具--》资源库--》断开资源库
使⽤上⾯的步骤来退出数据库资源库
2.1创建⽂件资源库
和上⾯创建数据库资源库的⽅式⼀样,但是选择的是创建⽂件资源库。
2.2在⽂件资源库下,创建⼀个DB连接,验证是否能在⽂件资源库内共享
答案是可以的
三、需求:将mysql中的表导出成txt⽂件
在ldp_huyu数据库中有如下的⼀张person表
3.1建⽴如下图的转换
其中表输⼊的配置:
其中⽂本⽂件输出的配置:
3.2运⾏这个转换
最后⽣成⽂件
四、数据库资源库和⽂件资源库的⽐较
使⽤数据库来管理,更容易跨平台和共享,但是在版本控制⽅⾯不如⽂件资源库好,并且数据库需要⾛⽹络,⽹络连接的异常也会导致job失败使⽤⽂件资源库⽐较⿇烦的是跨平台,⼀般和svn等版本控制的⼯具结合使⽤。
=======================================================================================
Kettle资源库的创建及密码修改
点击新建图标
选择数据库类型资源库Kettledatabase repository,点击“确定”
房地产营销策划报告在“Database Connection”窗⼝,选择数据库类型,并填写数据库连接的相关信息,本实例选⽤oracle数据库。
点击test按钮进⾏数据库连接测试
数据库连接正确后,点击“确定”,再点击“OK”,回到“资源库信息窗⼝”,点击“创建或更新”按钮
在弹出的“简单SQL编辑器”窗⼝中,点击“执⾏”按钮,执⾏相应的资源库创建脚本。(⽤户可以查看这些脚本具体是进⾏了什么操作:创建了46张表,并插⼊了⼀些相关信息数据,如
R_USER表⾥插⼊了admin和guest两个⽤户的信息,这两个⽤户也是该资源库的登录⽤户,想深⼊研究资源库的⽤户可以并⼀步去了解相关内容)
在“资源库信息”窗⼝,填写资源库的ID和名称,然后点击“确定”按钮。
温馨提⽰:建议使⽤英名,因为使⽤中⽂容易出现乱码,⽽使得退出后,下次登录资源库时⽆法到相应的配置,遇到此类情况,可根据下⼀章节“资源库名称乱码问题解决⽅法”进⾏相关修改设置。
在“资源库连接RepositoryConnection”窗⼝,选择刚才创建的资源库“备付⾦系统”,填写⽤户名和密码,新建的资源库的默认⽤户和密码有两个,admin/admin和guest/guest,然后点
击“确定OK”按钮,即可登录资源库。
老公的英文为了资源库的安全,我们需要修改资源库⽤户的登录密码,“Tools” -->“资源库”-->“探索资源库”,可以使⽤快捷键CTRL + E。
在资源库探索“Repository explorer”窗⼝,选择“Security”选项卡,然后选择需要修改的⽤户再点击编辑按钮
填写新密码,然后点击“OK”按钮即可完成⽤户密码的修改
=======================================================================================
kettle常见的资源库有3种:数据库资源库、⽂件资源库、pentaho资源库。
⽂件资源库是在⼀个⽂件⽬录下定义⼀个资源库,因为kettle使⽤的是虚拟⽂件系统(Apache VFS),所以这⾥的⽂件⽬录是⼀个⼴泛的概念,包括了zip⽂件、web服务、FTP服务。 pentaho资源库是⼀个插件(kettle企业版中有),实际是⼀个内容管理系统(CMS),它具备⼀个理想的资源库的所有特性,包括版本控制和依赖完整性检查。
数据库资源库是把所有的ETL信息保存在关系型数据库中,包括数据库连接、转换和作业。将已开发的ETL转换、作业和相关配置保存在数据库资源库中便于保存、管理以及远程调度。本篇⽂章主要介绍数据库资源库创建⽅法:
1、进⼊spoon,⼯具--资源库--连接资源库,点击加号+新建资源库
2、选择数据库资源库,点击确定
3、数据库连接选择新建,配置数据库连接信息,建议新建⼀个空⽩数据库
4、配置好数据库连接,选择创建或更新,继续选择是
5、选择执⾏SQL语句
6、提⽰执⾏SQL错误,选择确定,稍后在处理这个错误,对上述sql执⾏提⽰的所有错误全部选择确定
7、现在连接刚刚创建的资源库会报错,如下
8、下⾯进⼊sql server客户端(因为这⾥使⽤的是sql server数据库资源库,根据使⽤的资源库作调整),连接刚刚创建的资源库,执⾏下⾯的SQL语句
DELETE TABLE R_VERSION;
CREATE TABLE R_VERSION
(
ID_VERSION INTEGER,
MAJOR_VERSION INTEGER,
MINOR_VERSION INTEGER,
UPGRADE_DATE DATETIME,
IS_UPGRADE CHARACTER (1)
);
INSERT INTO R_VERSION (ID_VERSION, MAJOR_VERSION, MINOR_VERSION, UPGRADE_DATE, IS_UPGRADE)
VALUES (1, 5, 0, '2017-09-13', 'N');
不同数据库的sql 语句写法可能不同,⽬标是让上⾯标红的sql语句成功执⾏
现在连接刚刚创建的数据库资源库会发现⽤户名密码错误,执⾏下⾯的sql语句,创建⼀个新的⽤户,此时的⽤户名密码都是admin
INSERT INTO R_USER (ID_USER, LOGIN, PASSWORD, NAME, DESCRIPTION, ENABLED)
VALUES (1, 'admin', '2be98afc86aa7f2e4cb79ce71da9fa6d4', 'Administrator', 'User manager', '1')
现在重新连接刚刚创建的资源库,⽤户名密码都是admin,连接成功!
=======================================================================================
2.1 资源库的介绍:
资源库是⽤来保存转换任务的,⽤户通过图形界⾯创建的的转换任务可以保存在资源库中。
资源库可以使多⽤户共享转换任务,转换任务在资源库中是以⽂件夹形式分组管理的,⽤户可以⾃定义⽂件夹名称。
资源库有两种形式:
过年祝福的成语⼀、Kettledatabase repository,即保存在各种常见的数据库资源库类型,⽤户通过⽤户名/密码来访问资源库中的资源,默认的⽤户名/密码是admin/admin和guest/guest。
⼆、Kettle filerepository,保存在服务器硬盘⽂件夹内的资源库类型,此类型的资源库⽆需⽤户进⾏登录,直接进⾏操作。
(当然,资源库并不是必须的,如果没有资源库,⽤户还可以把转换任务保存在xml⽂件中。为了⽅便管理,建议⽤户建⽴并使⽤数据库类型资源库Kettle database repository。)
2.2 创建资源库:
运⾏spoon之后:
夜里做了美丽的噩梦选择 Tools---->资源库----->连接资源库:
在弹出的窗⼝中,选择加号进⾏新建,如下图:(此处由于之前有⼀个资源库,因此会提⽰输⼊⽤户密码)
在 “Select the repository type” 窗⼝中,选择第⼀个 “Kettle database repository :...” ,点击“确定”:
在资源库信息中,选择“新建”来新建数据库连接:
填写数据库信息:(此处使⽤oracle数据库,jdbc连接⽅式)
点击“Test”测试连接:
点击“确定”,关闭测试窗⼝,点击“OK”,完成数据库信息填写,回到资源库信息界⾯,选择“testdb1”,并填写 ID和名称:
点击“创建或更新”,弹出提⽰如下:
点击“是”,会弹出设置管理员密码的窗⼝:
感谢老师的话输⼊,此处使⽤password,确定,弹出提⽰窗⼝如下:
点击“是”,会⽣成新窗⼝,内容是SQL脚本:
由于已经建⽴过⼀个资源库,因此此处的脚本与第⼀次的不太⼀样。
点击“Execute”执⾏脚本,弹出SQL运⾏结果的窗⼝:
点击“确定”,关闭此窗⼝,然后点击“关闭”,关闭SQL提⽰的窗⼝:
关闭SQL窗⼝之后,回到资源库信息的界⾯:
点击“确定”,关闭资源库信息窗⼝,此时就到了连接资源库的界⾯:
选择要连接的资源库“测试资源库”,输⼊管理员⽤户admin,密码password(刚刚设置的密码),点击“OK”进⾏连接。此时可以看⼀下左上⾓的信息:
说明我们此时连接了资源库“testdb1”。
可以与最开始时没有连接资源库时的状态对⽐:
创建资源库就完美完成了。是不是很简单~~~~~
之后每次打开Spoon都会提⽰连接资源库,连接资源库之后,我们做的所有开发包括转换、job等都保存在资源库中。
如果没有连接资源库,我们做的转换、job等开发可以保存为本地⽂件。
=======================================================================================
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论