1、Pentaho Data Integration 完全自学手册 (孟菲斯著)文档目录文档目录 .2更新记录 .17第一章. KETTLE 基础介绍 .181.1. 核心组件 .181.2. 组成部分 .181.3. 概念模型 .191.3.1. Transformation(转换) .191.3.2. Steps(步骤) .201.3.3. Hops(节点连接) .201.3.4. Jobs(工作) .201.3.5. Variable(变量) .211.3.5.1. 设置环境变量 .211.3.5.2. 设置变量 .211.4. 查看版本 .221.5. 选项设置 .23第二章. KETTL
2、E 环境搭建 .252.1. 单机部署 .252.1.1. 下载 kettle .252.1.2. 安装 kettle .252.1.3. 运行 Spoon .252.2. 集群部署 .261. Carte 简介 .262. Carte 部署配置 .262.1 启动方法 .262.2 启动配置 .262.3 Carte xml 文件配置详解 .272.3.1 slaveserver 节点 .282.3.2 masters 节点 .282.3.3 report_to_masters 节点 .282.3.4 max_log_lines 节点 .282.3.5 max_log_timeout_min
3、utes 节点 .282.3.6 object_timeout_minutes 节点 .292.3.7 (*) repository 节点 .293. Carte 集群 .293.1 普通集群 .303.2 动态集群 .302.3. 运行方式 .302.3.1. 转换执行器 Pan.302.3.1.1. Pan 参数介绍 .302.3.1.2. Pan 实例讲解: Windows.312.3.1.3. Pan 实例讲解: Linux .312.3.2. 任务执行器 Kitchen.322.3.2.1. Kitchen 参数介绍 .322.3.2.2. Kitchen 实例讲解:Windows
4、.332.3.2.3. Kitchen 实例讲解:Linux .342.4. 定时任务 .352.4.1. Windows .352.4.2. Linux.35第三章. KETTLE 基本功能 .363.1. 新建转换 .363.1.1. 方法 1.363.1.2. 方法 2.363.1.3. 方法 3.373.1.4. 主对象树 .373.1.5. 核心对象 .383.1.6. 新建数据库连接 .383.2. 转换实例 .393.2.1. 转换实例 1 .393.2.2. 转换实例 2 .393.3. 新建作业 .403.3.1. 方法 1.403.3.2. 方法 2.403.3.3. 方法
5、 3.413.3.4. 主对象树 .413.3.5. 核心对象 .423.4. 作业实例 .423.4.1. 作业实例 1 .423.4.2. 作业实例 2 .42第四章. KETTLE 设计环境 .424.1. TRANSFORMATION:转换步骤 (24-228) .424.1.1. Input:输入 (38) .424.1.1.1. Csv file input .424.1.1.1.1. 功能描述 .434.1.1.1.2. 操作步骤 .434.1.1.1.3. 实例讲解 .444.1.1.2. DataGrid .444.1.1.3. De-serialize from file:
6、文件反序列化 .444.1.1.4. ESRI Shapefile Reader.444.1.1.5. Email messages input .444.1.1.6. Fixed file input .444.1.1.7. GZIP CSV Input.444.1.1.8. Generate Rows .444.1.1.9. Generate random credit card numbers.444.1.1.10. Generate random value.454.1.1.11. Get File Names.454.1.1.12. Get Files Rows Count .454
7、.1.1.13. Get SubFolder names.454.1.1.14. Get System Info:获取系统信息 .454.1.1.14.1. 功能描述 .464.1.1.14.2. 操作步骤 .474.1.1.14.3. 实例讲解 .484.1.1.15. Get data from XML .494.1.1.16. Get repository names .494.1.1.17. Get table names.494.1.1.18. Google Analytics .494.1.1.19. HL7 Input .494.1.1.20. JSON Input .494.1
8、.1.21. LDAP Input .494.1.1.22. LDIF Input.504.1.1.23. Load file content in memory.504.1.1.24. Microsoft Access input .504.1.1.25. Microsoft Excel Input.504.1.1.25.1. 功能描述 .504.1.1.25.2. 操作步骤 .504.1.1.25.2.1. 指定文件名 .514.1.1.25.2.2. 指定内容 .514.1.1.25.2.3. 字段 .514.1.1.25.2.4. 错误处理 .514.1.1.25.2.5. 其他输出字段 .