kettle 提交数据量_kettle——入门操作(表输出)详细
时间: 2023-10-25 22:35:23 浏览: 79
Kettle(又名Pentaho Data Integration)是一款开源的ETL工具,可用于从不同数据源中提取、转换和加载数据。在Kettle中,表输出步骤用于将处理后的数据写入数据库表中。
要提交数据量,您需要在表输出步骤中配置以下选项:
1. 数据库连接:选择要写入的数据库连接。
2. 目标表:选择要写入的目标表。
3. 映射字段:将输入数据流中的字段映射到目标表中的字段。
4. 批量提交大小:指定每次提交的数据行数。较小的值会导致更频繁的提交,较大的值会导致更少的提交但可能会导致内存问题。建议从默认值1000开始,根据实际情况进行调整。
5. 其他高级选项:如果需要更细粒度的控制,可以使用其他高级选项,如缓冲区大小、批量提交超时等。
配置完成后,运行转换即可将数据提交到目标表中。在转换运行过程中,Kettle会将数据分批提交到目标表中,直到所有数据都被提交为止。
注意:在向数据库提交大量数据时,请确保您的数据库设置合适的缓存和日志配置,以避免性能问题和数据丢失。
相关问题
kettle中表kettle_job_logs
kettle_job_logs是Kettle中的一个表,用于记录作业(job)的执行日志。该表包含以下字段:
- id_job_log:作业日志的ID。
- id_job:作业的ID。
- id_batch:批处理的ID。
- channel_id:通道的ID。
- logging_object_id:日志对象的ID。
- object_name:对象名称。
- object_copy:对象副本。
- object_type:对象类型。
- log_date:日志日期。
- log_date_gmt:GMT日志日期。
- log_time:日志时间。
- status:状态。
- error_desc:错误描述。
- nr_lines_input:输入行数。
- nr_lines_output:输出行数。
- nr_lines_read:读取行数。
- nr_lines_written:写入行数。
- nr_lines_updated:更新行数。
- input_size:输入大小。
- output_size:输出大小。
- log_field:日志字段。
如果你想查询kettle_job_logs表中的数据,可以使用以下SQL语句:
```sql
SELECT * FROM kettle_job_logs;
```
如果你想根据作业ID查询kettle_job_logs表中的数据,可以使用以下SQL语句:
```sql
SELECT * FROM kettle_job_logs WHERE id_job = 'your_job_id';
```
如果你想根据日期范围查询kettle_job_logs表中的数据,可以使用以下SQL语句:
```sql
SELECT * FROM kettle_job_logs WHERE log_date BETWEEN 'start_date' AND 'end_date';
```
kettle中表kettle_trans_logs 的详解
Kettle 是一款开源的 ETL 工具,表 kettle_trans_logs 是 Kettle 中用于记录转换(Transformation)执行日志的表。
该表的结构如下:
| 字段名 | 类型 | 描述 |
| ------ | ---- | ---- |
| CHANNEL_ID | VARCHAR(255) | 转换通道 ID |
| LOG_DATE | TIMESTAMP | 日志时间 |
| LOGGING_OBJECT_TYPE | VARCHAR(255) | 记录类型,可选值为 Transformation 或 Job |
| OBJECT_NAME | VARCHAR(255) | 转换或作业名称 |
| OBJECT_COPY | VARCHAR(255) | 转换或作业的副本名称 |
| REPOSITORY_DIRECTORY | VARCHAR(255) | 仓库目录 |
| LOG_FIELD | VARCHAR(255) | 日志字段 |
| OLD_VALUE_STR | VARCHAR(255) | 旧值 |
| NEW_VALUE_STR | VARCHAR(255) | 新值 |
| ID_BATCH | VARCHAR(255) | 批处理 ID |
| ID_LOG | BIGINT(20) | 日志 ID |
其中,CHANNEL_ID、LOG_DATE、LOGGING_OBJECT_TYPE、OBJECT_NAME、ID_BATCH、ID_LOG 这几个字段是必须的,其他字段根据需要进行记录。
表 kettle_trans_logs 中的记录分为两种类型:转换(Transformation)日志和作业(Job)日志。如果 LOGGING_OBJECT_TYPE 字段的值为 Transformation,则表示该记录是转换日志;如果 LOGGING_OBJECT_TYPE 字段的值为 Job,则表示该记录是作业日志。
通过表 kettle_trans_logs,我们可以了解转换或作业的执行情况、异常情况、执行时间等信息,帮助我们进行问题排查和性能优化。在使用 Kettle 进行数据处理时,合理地利用 kettle_trans_logs 表是非常必要的。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)