Apache Hive 2.1.1 版本发布与安装指南

需积分: 10 16 浏览量更新于2024-11-13 收藏 140.13MB RAR 举报

资源摘要信息:"apache-hive-2.1.1-bin"是指Apache Hive的2.1.1版本的二进制发行版。Apache Hive是一个开源数据仓库软件，用于处理大规模数据集。它建立在Hadoop之上，提供了一系列用于数据查询和管理的工具，其查询语言是类SQL的HiveQL（HQL）。Hive定义了一个简单的类SQL查询语言，允许熟悉SQL的用户查询存储在Hadoop文件系统中的数据。从IT知识角度分析，以下是关于apache-hive-2.1.1-bin的关键知识点： 1. Hive的架构：Hive包含四个主要的组件：用户接口（如命令行和Web界面）、元数据存储（通常是一个关系数据库，存储表结构的定义）、驱动程序、编译器和优化器（将HiveQL转换成一系列用于处理数据的MapReduce任务）、以及执行器（运行实际的任务并返回结果）。 2. HiveQL语言：HiveQL允许用户查询和管理大数据。它类似于SQL，并为数据仓库操作提供了简单的查询语句。但是，HiveQL在执行时会将查询语句转换成MapReduce任务。 3. 数据存储：在Hive中，数据存储在Hadoop文件系统（HDFS）中，这是分布式存储系统，设计用来优化对大数据的读写操作。Hive能够管理存储在HDFS上的数据，而不需要关心底层的分布式存储细节。 4. 数据模型：Hive定义了一个类似于关系数据库的数据模型，包括表、分区、桶等概念。数据在Hive中是以表的形式存储的，表可以被分区以提高查询性能，还可以通过桶操作提高抽样查询的效率。 5. 集成和兼容性：Hive可以很好地集成到现有的Hadoop生态系统中，比如可以使用Hadoop的YARN进行资源管理，使用HBase作为底层存储，使用Pig语言进行数据处理。 6. 元数据管理：Hive的元数据存储在一个关系数据库中，通常使用MySQL或者Derby。元数据包括了表结构的定义、表中数据的位置、表的分区信息等。 7. 数据类型：Hive支持多种数据类型，包括基本数据类型（如int, float, boolean等）、复杂数据类型（如array, map, struct等），以及文本类型（如string, varchar等）。 8. 性能优化：Hive支持多种优化技术，包括分区剪裁、桶表和索引等。通过这些技术，Hive可以提高查询性能，尤其是在处理大数据集时。 9. Hive的安全性：Hive支持Kerberos认证、基于角色的访问控制（RBAC）、列级别的权限控制等安全特性，这些都可以帮助用户保护数据的安全。 10. Hive的版本更新和兼容性：2.1.1版本是在此之前版本的更新。版本更新通常会包括bug修复、性能改进以及新功能的引入。需要注意的是，随着版本的更新，可能会引入一些不兼容的变更，因此在升级时需要进行相应的兼容性测试。 11. Hive的部署和安装：Hive的安装和部署相对简单，可以作为一个独立的应用或者通过Hadoop集群的管理工具如Ambari或者Cloudera Manager进行安装。安装Hive通常需要Java环境，并配置好Hadoop和元数据库。 12. 用户接口：Hive提供了多种用户接口，用户可以通过命令行接口（CLI）、Web界面（如Hue）或者编程接口（如JDBC/ODBC、Thrift服务器等）进行交互。了解和掌握apache-hive-2.1.1-bin的这些知识点，对于IT专业人士在大数据处理领域进行数据仓库的构建、数据查询与分析、以及数据仓库的维护和优化工作具有重要意义。

收起资源包目录

apache-hive-2.1.1-bin （973个子文件）

hive 8KB

jetty-6.1.26.jar 527KB

hplsql 1KB

hive-hplsql-2.1.1.jar 675KB

hiveserver2.cmd 5KB

accumulo-core-1.6.0.jar 4.17MB

upgrade.order.derby 205B

slider-core-0.90.2-incubating.jar 1.7MB

lineage.cmd 1KB

calcite-core-1.6.0.jar 3.66MB

cli.cmd 2KB

employee2.dat 64B

UserVisits.dat 7KB

execHiveCmd.cmd 1KB

calcite-avatica-1.6.0.jar 3.15MB

2000_cols_data.csv 40KB

dec.avro 343B

httpclient-4.4.jar 702KB

employee.dat 105B

type_evolution.avro 167B

schemaTool.cmd 1KB

dec_old.avro 331B

hive-exec-2.1.1.jar 30.94MB

joda-time-2.5.jar 574KB

rcfilecat.cmd 1KB

derby-10.10.2.0.jar 2.71MB

small_csv.csv 2KB

beeline.cmd 2KB

FacebookService-remote 4KB

calcite-linq4j-1.6.0.jar 464KB

jcodings-1.0.8.jar 1.23MB

datanucleus-core-4.1.6.jar 1.92MB

flights_tiny.txt.1 5KB

hive-service-2.1.1.jar 497KB

hplsql.cmd 2KB

zookeeper-3.4.6.jar 774KB

jetty-all-7.6.0.v20120127.jar 1.6MB

hive-metastore-2.1.1.jar 7.4MB

jackson-databind-2.4.2.jar 1.03MB

grad.avsc 304B

protobuf-java-2.5.0.jar 521KB

php_thrift_protocol.h 964B

hbaseimport.cmd 1KB

ant-1.6.5.jar 1010KB

hcat 5KB

debug.cmd 3KB

janino-2.7.6.jar 598KB

snappy-java-1.0.5.jar 1.19MB

hbase-server-1.1.1.jar 3.79MB

hwi.cmd 2KB

fastutil-6.5.6.jar 16.12MB

doctors.avro 521B

test.dat 11B

parquet-hadoop-bundle-1.8.1.jar 2.77MB

guice-3.0.jar 694KB

groovy-all-2.4.4.jar 6.67MB

episodes.avro 597B

datanucleus-rdbms-4.1.7.jar 1.8MB

php_thrift_protocol.cpp 29KB

php_thrift_protocol.h 930B

in_file.dat 24B

hive-llap-server-2.1.1.jar 552KB

map_null_val.avro 341B

hbase-common-1.1.1.jar 517KB

orcfiledump.cmd 1KB

jar.cmd 1KB

lt100.txt.deflate 267B

htrace-core-3.1.0-incubating.jar 1.41MB

commons-math-2.2.jar 965KB

hbase-protocol-1.1.1.jar 4.01MB

ivy-2.4.0.jar 1.22MB

metastore.cmd 2KB

hive-orc-2.1.1.jar 684KB

jetty-all-server-7.6.0.v20120127.jar 1.61MB

hive-config.cmd 2KB

commons-collections-3.2.2.jar 575KB

hiveserver2 885B

templeton.cmd 3KB

hive-serde-2.1.1.jar 887KB

hive-service-rpc-2.1.1.jar 1.46MB

log4j-core-2.4.1.jar 968KB

cleardanglingscratchdir.cmd 1KB

hive-jdbc-2.1.1-standalone.jar 16.66MB

netty-3.7.0.Final.jar 1.15MB

beeline 1KB

help.cmd 1KB

map_null_schema.avro 187B

tephra-core-0.6.0.jar 620KB

netty-all-4.0.23.Final.jar 1.7MB

hbase-client-1.1.1.jar 1.19MB

ant-1.9.1.jar 1.9MB

hive.cmd 9KB

jaxb-impl-2.2.3-1.jar 869KB

jersey-server-1.14.jar 586KB

php_thrift_protocol.cpp 10KB

guava-14.0.1.jar 2.09MB

jsp-2.1-6.1.14.jar 1001KB

futurama_episodes.avro 3KB

test2.dat 23B

fastbinary.c 26KB

共 973 条

简单的小呆瓜

粉丝: 2w+
资源: 23

Apache Hive 2.1.1 版本发布与安装指南

apache-hive-2.1.1-bin.tar

apache-hive-2.1.1-bin.tar.gz下的bin文件夹，包含hive.cmd

apache-hive-2.1.1-bin.tar.gz

apache-hive-2.1.1-bin.tar.zip.002

apache-hive-2.1.1-bin.tar.gz.zip

apache-hive-2.1.1-bin.tar.zip.003

apache资源 apache-hive-1.2.2-bin.tar gz文件

apache-hive-2.1.0-bin.tar.gz

apache-kylin-4.0.1-bin-spark2-3.0.0-cdh6.2.0.tar.gz

最新资源