首页spark和hive区别

spark和hive区别

时间: 2023-11-10 18:21:57 浏览: 86

Spark和Hive的结合（让hive基于spark计算）

3星 · 编辑精心推荐

spark和hive结合 1.安装mysql 2.在spark/conf中创建一个hive-site.xml javax.jdo.option.ConnectionURL jdbc:mysql://192.168.224.132:3306/hive?createDatabaseIfNotExist=true JDBC connect string for a JDBC metastore javax.jdo.option.ConnectionDriverName com.mysql.jdbc.Driver Driver

Spark是一个开源的基于内存计算的分布式计算平台，而Hive是一个基于Hadoop的数据仓库工具，其通过SQL方式访问Hadoop存储中的数据。Spark分布式计算的速度比Hive要快很多，因为Spark采用了内存计算，而Hive采用了磁盘存储。另外，Spark也支持更多的数据处理方式和算法，比如流计算和机器学习算法。

阅读全文