dolphinscheduler project 血缘插入到datahub
时间: 2023-09-25 19:07:56 浏览: 68
DolphinScheduler 是一个分布式易扩展的可视化 DAG 工作流任务调度系统,而 DataHub 则是阿里巴巴集团开源的一种流数据集成平台。
如果你想要将 DolphinScheduler 中的血缘信息插入到 DataHub 中,可以参考以下步骤:
1. 在 DolphinScheduler 中配置 DataHub 的连接信息,包括主机名、端口号、用户名、密码等。
2. 在 DolphinScheduler 中创建任务,并在任务依赖图中添加血缘关系。
3. 在任务执行时,将血缘信息通过 DataHub API 接口插入到 DataHub 中。
需要注意的是,这个过程中需要编写一些代码来实现 DolphinScheduler 与 DataHub 的集成,具体实现需要根据你的实际情况进行调整。
相关问题
dolphinscheduler project 血缘插入到linkedin datahub
DolphinScheduler 是一个分布式易扩展的可视化 DAG 工作流任务调度系统,而 LinkedIn DataHub 则是 LinkedIn 开源的一种数据发现、数据血缘和数据消费平台。
如果你想要将 DolphinScheduler 中的血缘信息插入到 LinkedIn DataHub 中,可以参考以下步骤:
1. 在 DolphinScheduler 中配置 LinkedIn DataHub 的连接信息,包括主机名、端口号、用户名、密码等。
2. 在 DolphinScheduler 中创建任务,并在任务依赖图中添加血缘关系。
3. 在任务执行时,将血缘信息通过 LinkedIn DataHub API 接口插入到 LinkedIn DataHub 中。
需要注意的是,这个过程中需要编写一些代码来实现 DolphinScheduler 与 LinkedIn DataHub 的集成,具体实现需要根据你的实际情况进行调整。同时,LinkedIn DataHub 也提供了一些开箱即用的工具和 SDK,可以帮助你更快地实现数据血缘的插入和查询。
dolphinscheduler api 创建工作流
以下是使用DolphinScheduler API创建工作流的步骤:
1.登录DolphinScheduler并获取到登录凭证token。
2.创建工作流定义,包括工作流名称、描述、版本号、租户ID等信息。请求示例:
```shell
POST /dolphinscheduler/projects/{projectName}/processes HTTP/1.1
Host: dolphinscheduler-server-host:port
Content-Type: application/json
Authorization: Bearer token
{
"processDefinition": {
"name": "test_workflow",
"description": "test_workflow_description",
"locations": [
{
"name": "shell"
}
],
"tasks": [
{
"name": "task_1",
"description": "task_1_description",
"type": "SHELL",
"params": {
"rawScript": "echo 'hello world'"
},
"preTasks": [],
"postTasks": []
},
{
"name": "task_2",
"description": "task_2_description",
"type": "SHELL",
"params": {
"rawScript": "echo 'hello world'"
},
"preTasks": [
{
"name": "task_1",
"type": "SHELL"
}
],
"postTasks": []
},
{
"name": "task_3",
"description": "task_3_description",
"type": "SHELL",
"params": {
"rawScript": "echo 'hello world'"
},
"preTasks": [
{
"name": "task_2",
"type": "SHELL"
}
],
"postTasks": []
}
],
"timeout": {
"strategy": "FAILED",
"interval": 1,
"enable": false
},
"tenantId": 1,
"receivers": "",
"receiversCc": "",
"warningType": "NONE",
"processInstancePriority": "MEDIUM",
"workerGroupId": -1,
"timeoutFlag": false,
"taskRetryTimes": 0,
"retryInterval": 1,
"runFlag": "NORMAL",
"dependence": {
"relation": "AND",
"dependTaskList": []
},
"globalParams": []
},
"releaseState": "ONLINE"
}
```
3.创建工作流实例,即启动工作流。请求示例:
```shell
POST /dolphinscheduler/projects/{projectName}/processes/{processDefinitionId}/start-time HTTP/1.1
Host: dolphinscheduler-server-host:port
Content-Type: application/json
Authorization: Bearer token
{
"scheduleTime": "2022-01-01 00:00:00",
"failureStrategy": "END",
"startNodeList": [
{
"name": "task_1",
"type": "SHELL"
}
],
"taskDependType": "ALL_SUCCESS",
"timeout": {
"strategy": "FAILED",
"interval": 1,
"enable": false
},
"workerGroupId": -1,
"processInstancePriority": "MEDIUM",
"warningType": "NONE",
"startParams": "",
"runMode": "NORMAL",
"environmentParams": "",
"globalParams": []
}
```
4.查询工作流实例状态。请求示例:
```shell
GET /dolphinscheduler/projects/{projectName}/processes/{processInstanceId}/status HTTP/1.1
Host: dolphinscheduler-server-host:port
Content-Type: application/json
Authorization: Bearer token
```