flinkjar包冲突

引用[1]:由于spark，flink代码，只需要实现数据的读入转化为相应的数据结构，就可以通过spark-sql，flink-sql进行多源的数据处理。我们之前的做法是直接通过spark，flinkjar 包的方式，通过传入一个json路径，实现的同步。但是datax的插件的开发，是reader，writer接口独立开发的，而且数据也是一条条处理的，那么spark肯定不行了。flink的话，需要初始化flink环境，再去实现一个从接口拿去数据的sink，最后souce到hive上，感觉太过于笨重了。基于flume hcatalog（推荐）。[1] 引用[2]:将hdfs的文件导入hive，datax实现了hdfs的写入，只需要加一个hdfs导入hive就ok了，这个时候通过jdbc连接hive，执行load命令就ok了。需要修改源码的地方，datax在写入hdfs的时候，必须要一个存在的hdfs目录。指定的分区路径如果不存在就需要手工创建一个。在task实现完毕后，通过jdbcload进hive。[2] 引用[3]:公司要搭建数据中台，离线数据采集就是其中重要一环，目前是基于alibaba的datax组件来搞得。datax的优势，支持多源数据库之间相互同步，日志信息非常清楚，方便定位错误。而且基于datax二次开发也比较简单（实现job，task接口）。目前的缺点，对于hive的支持力度没那么大，目前官方只实现了hdfs的读写。对于如何基于datax写入hive本文做了一些自己尝试的方法。解决思路基于spark，flink框架。[3] 问题:flink jar包冲突回答: 当使用flink时，可能会遇到flink jar包冲突的问题。解决这个问题的一种方法是通过排除冲突的jar包来解决。可以在pom.xml文件中指定排除冲突的jar包的groupId和artifactId，以确保只使用所需的jar包。另一种方法是使用dependencyManagement来管理jar包的版本，以避免冲突。这样可以确保所有的jar包都使用相同的版本。另外，还可以使用maven的dependency tree命令来查看项目中所有的依赖关系，以便更好地解决jar包冲突的问题。[1]

相关推荐

dinky依赖flink1.14.6相关jar包

apache-flink-V20201112.zip

flink-sql-demo.jar

Java swing + socket + mysql 五子棋网络对战游戏FiveChess.zip

纯C语言实现的控制台有禁手五子棋(带AI）Five-to-five-Renju.zip

setuptools-57.1.0.tar.gz

setuptools-59.1.1.tar.gz

空载损耗计算软件.zip

贪吃蛇.cpp

Gobang Game programmed by C(五子棋游戏)Gobang.zip

单片机C语言Proteus仿真实例用DS1302与数码管设计的可调电子表

二叉树的遍历hahahha

setuptools-3.8.1.zip

基于linux开发C语言编程五子棋小游戏inset.zip

Linux下，C语言实现五子棋程序Linux-Wuziqi.zip

飞机大战pygame_demo.zip

K210SD卡掉电存储的人脸识别

setuptools-47.3.2.zip

复制粘贴功能，简单实用

最新推荐

Java swing + socket + mysql 五子棋网络对战游戏FiveChess.zip

纯C语言实现的控制台有禁手五子棋(带AI）Five-to-five-Renju.zip

setuptools-57.1.0.tar.gz

setuptools-59.1.1.tar.gz

空载损耗计算软件.zip

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

用matlab绘制高斯色噪声情况下的频率估计CRLB，其中w(n)是零均值高斯色噪声，w(n)=0.8*w(n-1)+e(n)，e(n)服从零均值方差为se的高斯分布

JSBSim Reference Manual