Hive on Spark 搭建过程(hvie-3.1.2 spark-2.4.5 hadoop-3.1.3)

以下是 Hive on Spark 搭建过程的详细步骤： 1. 下载 Hadoop、Spark 和 Hive 的压缩包，并解压到指定目录下。 2. 配置环境变量，将 Hadoop、Spark 和 Hive 的 bin 目录添加到 PATH 路径中。 3. 修改 Hadoop 和 Spark 的配置文件。 - Hadoop 的配置文件：$HADOOP_HOME/etc/hadoop/core-site.xml、$HADOOP_HOME/etc/hadoop/hdfs-site.xml、$HADOOP_HOME/etc/hadoop/mapred-site.xml、$HADOOP_HOME/etc/hadoop/yarn-site.xml。 - Spark 的配置文件：$SPARK_HOME/conf/spark-env.sh、$SPARK_HOME/conf/spark-defaults.conf。 4. 配置 Hive on Spark。 - 将 $HIVE_HOME/lib 下的 spark 相关 jar 包复制到 $SPARK_HOME/jars 目录下。 - 修改 $HIVE_HOME/conf/hive-site.xml 文件，添加以下配置： ``` <property> <name>hive.execution.engine</name> <value>spark</value> </property> <property> <name>spark.master</name> <value>local[*]</value> <description>Master URL for the cluster manager.</description> </property> <property> <name>spark.submit.deployMode</name> <value>client</value> <description>Whether to launch the driver program locally ("client") or on one of the worker machines inside the cluster ("cluster")</description> </property> ``` 5. 启动 Spark 集群。 - 启动 Hadoop 集群。 - 启动 Spark 集群，可以使用以下命令： ``` $SPARK_HOME/sbin/start-all.sh ``` 6. 启动 Hive on Spark。 - 启动 HiveServer2，可以使用以下命令： ``` $HIVE_HOME/bin/hiveserver2 --service metastore & ``` - 启动 beeline 或 hive 命令行客户端，连接 HiveServer2。 7. 测试 Hive on Spark 是否正常运行。 - 在 beeline 或 hive 命令行客户端中执行以下命令： ``` CREATE TABLE test_spark(id INT, name STRING) USING org.apache.spark.sql.parquet OPTIONS (PATH '/tmp/test_spark'); INSERT INTO test_spark VALUES(1, 'test'); SELECT * FROM test_spark; ``` 如果查询结果正确，说明 Hive on Spark 搭建成功。希望这些步骤能够帮助到你。

Hive on Spark 搭建过程(hvie-3.1.2 spark-2.4.5 hadoop-3.1.3)

相关推荐

hive-spark-client-3.1.2.jar

hive-jdbc-uber-3.1.2+yanagishima-18.0

spark--bin-hadoop3-without-hive.tgz

linux搭建hive on spark环境(spark-1.6.3-without-hive+hadoop2.8.0+hive2.1.1)

配置hive on spark spark版本2.4.5 hive版本3.1.2

sparksql与hive整合（spark-on-hive）

sql on hadoop性能对比－hive、spark sql、impala

apache-hive-3.1.2-bin.tar.gz

hive-jdbc-3.1.2-standalone.jar

大数据最佳实践-hive on spark

hive-3.1.2版本赋予角色任意库操作权限

hive/spark练习--电商消费数据查询

Windows hive-3.1.2初始化mysql8数据库命令

hive-3.1.2版本怎么使用hadoop用户作为管理员用户执行全部数据和权限操作

hive-3.1.2版本赋予用户任意库操作权限

cp: 无法获取"…/apache-hive-3.1.2/lib/hive-exec-3.1.2.jar" 的文件状态(stat): 没有那个文件或目录

spark-3.3.0-bin-hadoop3.tg和spark-3.3.0-bin-without-hadoop.tgz

sparkshell 操作hive表_Spark记录-Spark-Shell客户端操作读取Hive数据

最新推荐

win10下搭建Hadoop环境（jdk+mysql+hadoop+scala+hive+spark） 3.docx

Hive on Spark源码分析DOC

Spark-shell批量命令执行脚本的方法

大数据基础操作说明-HADOOP HIVE IMPALA

HIVE-SQL开发规范.docx

GO婚礼设计创业计划：技术驱动的婚庆服务

管理建模和仿真的文件

【基础】PostgreSQL的安装和配置步骤

字节跳动面试题java

微信行业发展现状及未来发展趋势分析