在CentOS8上测试通过的无Hive的Spark和Hadoop3压缩包介绍

需积分: 50 122 浏览量更新于2024-11-16 收藏 174.47MB TGZ 举报

1. 文件名称分析： - "spark--bin-hadoop3-without-hive.tgz" 表示这是一个经过tar命令压缩并且使用gzip算法压缩的tarball压缩包文件。 - 文件名中的"spark"表明该压缩包与Apache Spark有关。 - "bin"通常表示二进制文件（binary files）。 - "hadoop3"表示该版本的Spark是与Hadoop 3.1.3兼容的版本，但不包含Hive的支持。 - "without-hive"明确指出该Spark发行版不包含Apache Hive的支持。Apache Hive是一个建立在Hadoop之上的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，但在这个特定的版本中它被排除了。 2. Hadoop版本分析： - "hadoop是3.1.3"说明该Spark版本是为与Hadoop 3.1.3版本配合使用的。Hadoop是一个开源框架，允许使用简单的编程模型跨分布式环境存储和处理大数据。版本号3.1.3意味着这是一个稳定版，通常意味着它包含了一系列的bug修复和新特性。 3. 系统环境要求分析： - "centOS8下测试通过"提示我们这个Spark版本是在CentOS 8操作系统环境下测试并验证过其兼容性和功能的。CentOS 8是基于Red Hat Enterprise Linux的免费Linux发行版，它提供了企业级的稳定性，因此，该Spark版本预期能够在类似的Linux环境下良好运行。 4. 标签相关知识点： - "spark"标签说明了该文件与Apache Spark紧密相关。Apache Spark是一个开源的集群计算系统，提供了快速、通用的引擎，用于大规模数据处理。它具有Hadoop MapReduce的多项优点，但支持多种数据处理模型，包括批处理、流处理、机器学习和图形计算。 - "hive"标签表明通常Spark版本会提供对Hive的支持，但在该特定文件中，Hive是被排除在外的。 - "hiveonspark"标签通常指在Spark上运行Hive的能力，但因为该文件是"without-hive"版本，所以不支持这一特性。 5. 应用场景分析： - 该文件很可能是为那些需要运行Spark，但不依赖Hive进行数据仓库操作的用户准备的。这可能包括那些已经使用其他数据仓库解决方案，或者对实时数据处理有特定需求的用户。 - 对于已经部署了Hadoop 3.1.3集群并且需要一个能够无缝集成到该环境中的Spark版本的用户来说，这是一个理想的选择。 - 同样，这也可以用于测试环境或者教学目的，特别是那些想要单独学习和理解Spark如何与Hadoop集成而不需要额外Hive层的场景。 6. 安装和部署： - 用户需要将"spark--bin-hadoop3-without-hive.tgz"文件下载到目标系统（比如CentOS 8服务器）。 - 解压缩文件，通常可以使用命令“tar -zxvf spark--bin-hadoop3-without-hive.tgz”。 - 解压缩后，用户需要根据环境配置Spark的环境变量，设置SPARK_HOME，以及可能需要编辑配置文件以适应具体的Hadoop集群设置。 - 配置完成后，用户可以通过SPARK_HOME目录中的脚本启动Spark shell或提交Spark作业到集群上运行。 7. 版本兼容性和升级： - 使用该压缩包的用户需要注意，虽然该Spark版本与Hadoop 3.1.3兼容，但未来版本可能需要重新验证兼容性。 - 升级Spark或Hadoop时，需要检查新版本的兼容性，并根据情况调整配置。 8. 相关技术栈： - Apache Spark：分布式数据处理引擎，与Hadoop集成，支持多种计算模型。 - Hadoop：大数据存储和处理框架，提供了HDFS用于数据存储，以及YARN用于资源管理。 - CentOS 8：一个Linux发行版，广泛用于服务器部署，提供了稳定的操作系统环境。通过上述分析，我们可以全面理解"spark--bin-hadoop3-without-hive.tgz"文件的背景知识、应用场景、系统要求以及安装部署步骤等相关信息。这为实际部署和使用该Spark版本提供了详细的背景支持和实用指导。

资源目录

收起资源包目录

在CentOS8上测试通过的无Hive的Spark和Hadoop3压缩包介绍（981个子文件）

.part-r-00007.gz.parquet.crc 12B

spark-core_2.12-2.4.5.jar 8.29MB

hadoop-yarn-common-3.1.3.jar 2.71MB

_metadata 743B

jackson-mapper-asl-1.9.13.jar 762KB

scala-compiler-2.12.12.jar 10.25MB

lpsa.data 10KB

zookeeper-3.4.9.jar 788KB

make2.bat 7KB

_SUCCESS 0B

spark-2.4.5-yarn-shuffle.jar 30.05MB

mssql-jdbc-6.2.1.jre7.jar 774KB

spark-sql.cmd 1KB

hadoop-hdfs-client-3.1.3.jar 4.83MB

user.avsc 185B

layout.html 207B

make.bat 199B

ivy-2.4.0.jar 1.22MB

hadoop-mapreduce-client-common-3.1.3.jar 785KB

.gitignore 49B

ages.csv 26B

scala-library-2.12.12.jar 5.18MB

netty-3.9.9.Final.jar 1.27MB

spark-mllib_2.12-2.4.5.jar 5.06MB

setup.cfg 854B

pyspark.cmd 1KB

_SUCCESS 0B

pyspark2.cmd 2KB

commons-math3-3.4.1.jar 1.94MB

spark-examples_2.11-2.4.5.jar 1.41MB

spark-defaults.conf 1KB

load-spark-env.cmd 2KB

spark-shell.cmd 1KB

_common_metadata 210B

jtransforms-2.4.0.jar 747KB

spark-sql2.cmd 1KB

scala-reflect-2.12.12.jar 3.48MB

spark-submit.cmd 1KB

.part-r-00004.gz.parquet.crc 12B

users.avro 334B

jersey-server-2.22.2.jar 929KB

zstd-jni-1.3.2-2.jar 2.23MB

pyspark.css 2KB

snappy-java-1.1.7.3.jar 1.93MB

sparkR2.cmd 1KB

orc-mapreduce-1.5.5-nohive.jar 793KB

.coveragerc 872B

.part-r-00008.gz.parquet.crc 12B

hadoop-mapreduce-client-core-3.1.3.jar 1.58MB

sparkR.cmd 1KB

.part-r-00002.gz.parquet.crc 12B

people.csv 49B

avro-1.8.2.jar 1.48MB

spark-class.cmd 1KB

jersey-common-2.22.2.jar 682KB

.part-r-00000-829af031-b970-49d6-ad39-30460a0be2c8.orc.crc 12B

spark-streaming_2.12-2.4.5.jar 1.1MB

httpclient-4.5.6.jar 749KB

find-spark-home.cmd 3KB

incremental-compiler-0.13.5.jar 2.11MB

leveldbjni-all-1.8.jar 1021KB

spire_2.12-0.13.0.jar 9.21MB

ehcache-3.3.1.jar 1.65MB

.part-r-00000-829af031-b970-49d6-ad39-30460a0be2c8.orc.crc 12B

breeze_2.12-0.13.2.jar 12.7MB

beeline 1KB

javassist-3.18.1-GA.jar 697KB

sisu-guava-0.9.9.jar 1.44MB

janino-3.0.9.jar 783KB

hadoop-yarn-api-3.1.3.jar 2.96MB

orc-core-1.5.5-nohive.jar 1.49MB

guice-4.0.jar 653KB

shapeless_2.12-2.3.2.jar 2.7MB

hadoop-yarn-server-common-3.1.3.jar 1.27MB

.part-r-00005.gz.parquet.crc 12B

joda-time-2.9.3.jar 613KB

beeline.cmd 1KB

spark-catalyst_2.12-2.4.5.jar 6.78MB

spark-shell2.cmd 2KB

htrace-core4-4.1.0-incubating.jar 1.43MB

commons-configuration2-2.1.1.jar 602KB

ages_newlines.csv 87B

spark-sql_2.12-2.4.5.jar 5.51MB

jackson-databind-2.6.7.3.jar 1.11MB

spark-class2.cmd 3KB

full_user.avsc 240B

test.data 128B

arpack_combined_all-0.1.jar 1.14MB

find-spark-home 2KB

MANIFEST.in 1KB

spark-submit2.cmd 1KB

arrow-vector-0.10.0.jar 1.26MB

hadoop-common-3.1.3.jar 3.91MB

hppc-0.7.2.jar 1.59MB

curator-client-2.12.0.jar 2.31MB

run-example.cmd 1KB

netty-all-4.1.42.Final.jar 3.89MB

guava-14.0.1.jar 2.09MB

jersey-guava-2.22.2.jar 949KB

spark-network-common_2.12-2.4.5.jar 2.28MB

共 981 条

badcodeSSS

粉丝: 1

在CentOS8上测试通过的无Hive的Spark和Hadoop3压缩包介绍

最新资源