springboot整合easy-es和canbal、kafka实现mysql数据同步，支持数据全量和增量同步

Spring Boot 整合 Easy-ES、Canal 和 Kafka 可以实现 MySQL 数据的全量和增量同步。下面简单介绍一下具体步骤： 1. 集成 Easy-ES （1）在 pom.xml 中添加 Easy-ES 依赖： ``` <dependency> <groupId>com.alibaba</groupId> <artifactId>easy-es-spring-boot-starter</artifactId> <version>2.3.0</version> </dependency> ``` （2）在 application.yml 中配置 Easy-ES： ``` spring: elasticsearch: rest: uris: http://127.0.0.1:9200 easy-es: enabled: true index-prefix: my_index refresh-interval: 5s ``` 2. 集成 Canal （1）在 pom.xml 中添加 Canal 依赖： ``` <dependency> <groupId>com.alibaba.otter</groupId> <artifactId>canal.client</artifactId> <version>1.1.4</version> </dependency> ``` （2）在 application.yml 中配置 Canal： ``` canal: client: # canal server的ip地址和端口号 servers: 127.0.0.1:11111 # 监听的实例名称，多个实例用逗号分隔 instance: my_instance # 连接 Canal server 的用户名和密码 username: password: destination: # 数据源名称 schema: my_db # 数据库连接信息 url: jdbc:mysql://127.0.0.1:3306/my_db?serverTimezone=Asia/Shanghai&useUnicode=true&characterEncoding=utf-8 username: root password: root filter: # 监听表的正则表达式，多个表用逗号分隔 include: .*\\..* ``` 3. 集成 Kafka （1）在 pom.xml 中添加 Kafka 依赖： ``` <dependency> <groupId>org.springframework.kafka</groupId> <artifactId>spring-kafka</artifactId> <version>2.5.4.RELEASE</version> </dependency> ``` （2）在 application.yml 中配置 Kafka： ``` spring: kafka: bootstrap-servers: 127.0.0.1:9092 producer: retries: 0 consumer: group-id: my_group_id auto-offset-reset: earliest properties: max.poll.interval.ms: 600000 ``` 4. 实现数据同步（1）全量同步全量同步可以通过 Easy-ES 的 `com.alibaba.easysearch.indexbuilder.IndexBuilderFactory` 类来实现。在应用启动时，通过监听 `ApplicationReadyEvent` 事件，获取 MySQL 数据并调用 `com.alibaba.easysearch.indexbuilder.IndexBuilderFactory.buildFullIndex()` 方法来创建索引，具体代码如下： ``` @Component public class FullIndexBuilder implements ApplicationListener<ApplicationReadyEvent> { @Autowired private IndexBuilderFactory indexBuilderFactory; @Override public void onApplicationEvent(ApplicationReadyEvent applicationReadyEvent) { // 获取 MySQL 数据并创建索引 indexBuilderFactory.buildFullIndex(); } } ``` （2）增量同步增量同步可以通过 Canal 和 Kafka 实现。Canal 监听 MySQL 数据库变化，将变化信息发送到 Kafka 中，然后在消费者中获取变化信息并更新索引。首先创建一个 Canal 客户端： ``` @Component public class CanalClient { private static final Logger logger = LoggerFactory.getLogger(CanalClient.class); @Autowired private KafkaTemplate<String, String> kafkaTemplate; @Value("${canal.client.servers}") private String servers; @Value("${canal.client.instance}") private String instance; @PostConstruct public void init() { CanalConnector connector = CanalConnectors.newClusterConnector(servers, instance, "", ""); int batchSize = 1000; try { connector.connect(); connector.subscribe(".*\\..*"); connector.rollback(); while (true) { Message message = connector.getWithoutAck(batchSize); long batchId = message.getId(); if (batchId == -1 || message.getEntries().isEmpty()) { continue; } List<String> messages = new ArrayList<>(); for (CanalEntry.Entry entry : message.getEntries()) { if (entry.getEntryType() == CanalEntry.EntryType.ROWDATA) { RowChange rowChange; try { rowChange = RowChange.parseFrom(entry.getStoreValue()); } catch (Exception e) { throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(), e); } String tableName = entry.getHeader().getTableName(); EventType eventType = rowChange.getEventType(); for (CanalEntry.RowData rowData : rowChange.getRowDatasList()) { String messageJson = JSON.toJSONString(rowData.getAfterColumnsList() .stream() .collect(Collectors.toMap(CanalEntry.Column::getName, CanalEntry.Column::getValue))); messages.add(tableName + "|" + eventType + "|" + messageJson); } } } if (!messages.isEmpty()) { kafkaTemplate.send("my_topic", StringUtils.join(messages, "\n")); } connector.ack(batchId); } } catch (Exception e) { logger.error("CanalClient error", e); } finally { connector.disconnect(); } } } ``` 然后创建一个 Kafka 消费者，获取变化信息并更新索引： ``` @Component public class IncrementIndexBuilder { private static final Logger logger = LoggerFactory.getLogger(IncrementIndexBuilder.class); @Autowired private IndexBuilderFactory indexBuilderFactory; @KafkaListener(topics = "my_topic") public void listen(ConsumerRecord<String, String> record) { String[] fields = StringUtils.split(record.value(), "|"); String tableName = fields[0]; String eventType = fields[1]; String messageJson = fields[2]; try { Map<String, Object> message = JSON.parseObject(messageJson, new TypeReference<Map<String, Object>>() {}); if ("INSERT".equals(eventType)) { indexBuilderFactory.buildIndex(tableName, message); } else if ("UPDATE".equals(eventType)) { indexBuilderFactory.updateIndex(tableName, message); } else if ("DELETE".equals(eventType)) { indexBuilderFactory.deleteIndex(tableName, message); } } catch (Exception e) { logger.error("IncrementIndexBuilder error", e); } } } ``` 到此为止，我们就实现了 Spring Boot 整合 Easy-ES、Canal 和 Kafka 实现 MySQL 数据的全量和增量同步。

阅读全文

springboot整合easy-es和canbal、kafka实现mysql数据同步，支持数据全量和增量同步

相关推荐

Springboot整合Spring-Kafka实现高效消息生产者

实时处理-OGG实现Oracle到Kafka的增量数据实时同步详解

宜信数据一致性与实时同步：日志与Kafka的创新解决方案

springboot整合easy-es、canbal、kafka实现mysql数据同步的代码

springboot整合easy-es-boot-starter和canbal、kafka实现mysql数据同步的接口，可实现手动刷新索引

Java开发案例-springboot-08-整合Kafka-源代码+文档.rar

springboot-postgres-kafka：kafka ITL Hadoop

springboot 基于spring-kafka动态创建kafka消费者

myDemo-dubbo-springboot-kafka:dubbo-springboot-kafka

通过springboot 实现spring和kafka集成springboot-kafka-master.zip

SpringBoot整合Mybatis-Plus+Oracle+Mysql

springboot-kafka:springboot整合kafka实现消息的发送与消费学习

springboot整合spring-kafka kafkaTemplate

springboot-hbase-kafka-master.zip

springboot-kafka:springboot-kafka

springboot-kafka--消息队列

springboot-kafka-simple-demo

springboot整合easy-es、canbal、kafka实现mysql数据同步到es,支持全量和增量刷新数据

springboot整合easy-es、canbal、kafka实现mysql数据同步到es，支持全量和增量刷新数据

springboot整合easy-es、canbal、kafka实现mysql数据同步到es，支持全量和增量刷新数据的代码

大家在看

MSC.MARC python后处理库py_post（数据提取）

WebBrowser脚本错误的完美解决方案

RealityCapture中文教程

二维Hilbert-Huang变换及其在图像增强中的应用 (2009年)

matlab-基于互相关的亚像素图像配准算法的matlab仿真-源码

最新推荐

OGG实现ORACLE数据到大数据平台KFAKF的实时同步到KUDU数据库

MySql准实时同步数据到HDFS(单机版).docx

python3实现从kafka获取数据,并解析为json格式,写入到mysql中

kafka-python批量发送数据的实例

Java实现批量向mysql写入数据的方法

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅