Phoenix-Hive: 极速实现Hive到Phoenix的数据交互

需积分: 9 19 浏览量更新于2024-11-16 收藏 283.45MB ZIP 举报

资源摘要信息: "Phoenix-Hive:初始提交" 知识点详述: 标题所指的"Phoenix-Hive"是一个初始提交的项目名称，它是针对Hadoop生态系统中的数据仓库工具Apache Hive的一个扩展或插件。Hive是用来处理大型数据集的高层次数据仓库工具，而Phoenix是建立在HBase之上的高性能关系数据库层，它允许用户通过标准JDBC API来执行SQL查询。"Phoenix-Hive"项目的出现意味着它旨在为Hive提供一个与Phoenix表交互的接口，从而实现数据的高效处理和低延迟读写。从描述中可以提取出以下知识点： 1. PhoenixStorageHandler：这是一个专门为Hive设计的存储处理程序，用于在ETL（提取、转换、加载）工作流程中提供与Phoenix表的交互能力。 2. ETL工作流：ETL是一种数据集成的过程，其中数据从不同的源系统中被提取出来，经过转换，然后加载到目标系统中，通常是一个数据仓库或数据湖。在数据仓库中，ETL工作流对于数据的整合和处理至关重要。 3. ORC文件格式：Optimized Row Columnar（ORC）是Hadoop生态系统中用于存储Hive数据的一种高效列存储格式，旨在提供更快的查询性能、更小的存储空间和更低的磁盘I/O。 4. 低延迟和并发访问：Phoenix表被设计为支持极低的数据读写延迟和高并发访问，这对于需要快速响应时间的应用程序来说是非常重要的。 5. INSERT INTO：这是一个SQL语句，用于将数据插入到数据库表中。在该项目中，开发者希望将这个操作简化为像在Hive中一样简单透明。限制部分包含了以下知识点： 1. 仅支持MapReduce作为执行引擎：Phoenix-Hive目前只适用于使用MapReduce作为执行引擎的环境。MapReduce是Hadoop的一个组件，用于处理大规模数据集的并行运算。 2. Hive Primitive 类型：该项目目前仅支持Hive的基本数据类型，而缺少了Phoenix中可用的复杂数据类型，如Array类型。这可能会影响数据类型在Hive与Phoenix之间的转换和使用。 3. 谓词下推（Predicate Pushdown）：这是一个优化技术，其中查询的过滤操作尽可能在数据读取之前推送到数据存储层。虽然目前版本中该功能非常有限，但在下一个版本中会有所改进。谓词下推可以显著提高查询效率，因为它减少了需要处理的数据量。标签"Java"指的是这个项目使用Java编程语言开发。Java在企业级应用和大数据处理中非常流行，特别是在Hadoop生态系统中，很多组件都是使用Java开发的。最后，文件名称列表中的"Phoenix-Hive-master"表明这是一个源代码仓库中的主分支（master branch），存放了项目的主要代码和文档。开发者可以从这个仓库获取代码，并进行本地开发、构建和部署。

收起资源包目录

Phoenix-Hive:初始提交（379个子文件）

jets3t-0.6.1.jar 314KB

hbase-server-0.98.4-hadoop2-tests.jar 3.83MB

tools.jar 14.58MB

jackson-mapper-asl-1.8.8.jar 653KB

commons-configuration-1.6.jar 292KB

jersey-core-1.8.jar 447KB

httpclient-4.0.1.jar 284KB

commons-compress-1.4.1.jar 236KB

HiveConfigurationUtil.class 8KB

phoenix-core-4.2.0.jar 2.66MB

phoenix-hive-4.2.2-jar-with-dependencies copy.jar 75.04MB

hbase-server-0.98.4-hadoop2.jar 3.3MB

zookeeper-3.4.5.jar 762KB

hadoop-mapreduce-client-core-2.2.0.jar 1.39MB

HiveConnectionUtil.class 4KB

hive-metastore-0.13.0.jar 4.46MB

jasper-compiler-5.5.23.jar 399KB

jersey-server-1.8.jar 678KB

PhoenixOutputCommitter.class 1KB

grizzly-http-2.1.2.jar 247KB

grizzly-framework-2.1.2.jar 674KB

PhoenixInputSplit.class 4KB

guava-16.0.jar 2.12MB

PhoenixHiveDBWritable.class 4KB

netty-3.6.6.Final.jar 1.15MB

phoenix-hive.iml 15KB

guice-3.0.jar 694KB

commons-httpclient-3.0.1.jar 273KB

phoenix-hive-4.2.2-jar-with-dependencies.jar 75.05MB

hive-serde-0.13.0.jar 714KB

HiveTypeUtil$1.class 986B

hadoop-yarn-api-2.2.0.jar 1.11MB

datanucleus-rdbms-3.2.9.jar 1.73MB

HivePhoenixInputFormat.class 9KB

avro-1.7.5.jar 391KB

junit-4.11.jar 239KB

PhoenixMapReduceUtil.class 3KB

.classpath 1KB

antlr-2.7.7.jar 435KB

hbase-client-0.98.4-hadoop2.jar 905KB

datanucleus-core-3.2.10.jar 1.8MB

HiveTypeUtil.class 5KB

ant-1.9.1.jar 1.9MB

hive-exec-0.13.0.jar 14.44MB

ColumnInfoToStringEncoderDecoder$1.class 1KB

HivePhoenixRecordWriter.class 4KB

ConnectionUtil.class 1KB

DEPENDENCIES 26KB

grizzly-http-servlet-2.1.2.jar 329KB

DEPENDENCIES 26KB

hadoop-common-2.2.0.jar 2.61MB

HiveConstants.class 607B

antlr-3.5.jar 1.09MB

derby-10.10.1.1.jar 2.7MB

junit-4.12-beta-3.jar 308KB

ColumnInfoToStringEncoderDecoder.class 2KB

PhoenixHiveConfiguration.class 3KB

PhoenixRecordWriter.class 4KB

hadoop-yarn-common-2.2.0.jar 1.24MB

hbase-protocol-0.98.4-hadoop2.jar 3.23MB

PhoenixHiveConfiguration$PhoenixHiveConfigurationUtil.class 992B

HivePhoenixOutputCommitter.class 2KB

phoenix-hive-4.2.0-jar-with-dependencies.jar 73.51MB

PhoenixSerde.class 8KB

HivePhoenixInputSplit.class 3KB

PhoenixOutputFormat.class 3KB

snappy-java-1.0.5.jar 1.19MB

PhoenixInputFormat.class 6KB

commons-codec-1.7.jar 254KB

HiveConfigurationUtil$1.class 2KB

commons-lang-2.4.jar 256KB

commons-lang3-3.1.jar 308KB

commons-net-3.1.jar 267KB

PhoenixConfigurationUtil$SchemaType.class 1KB

log4j-1.2.17.jar 478KB

commons-math-2.1.jar 813KB

PhoenixSerde$1.class 976B

PhoenixStorageHandler.class 4KB

jackson-core-asl-1.8.8.jar 222KB

commons-collections-3.2.1.jar 562KB

jaxb-impl-2.2.3-1.jar 869KB

PhoenixMetaHook.class 7KB

velocity-1.5.jar 383KB

PhoenixRecordReader.class 7KB

snappy-java-1.1.0.1.jar 420KB

HivePhoenixRecordReader.class 7KB

libthrift-0.9.0.jar 339KB

ST4-4.0.4.jar 231KB

groovy-all-2.1.6.jar 6.08MB

PhoenixUtil.class 8KB

PhoenixConfigurationUtil.class 11KB

phoenix-core-4.2.2.jar 2.71MB

datanucleus-api-jdo-3.2.6.jar 332KB

hbase-common-0.98.4-hadoop2.jar 431KB

protobuf-java-2.5.0.jar 521KB

jsp-2.1-6.1.14.jar 1001KB

DEPENDENCIES 26KB

jetty-6.1.26.jar 527KB

libfb303-0.9.0.jar 269KB

HivePhoenixOutputFormat.class 3KB

共 379 条

看不见的天边

粉丝: 25
资源: 4610

Phoenix-Hive: 极速实现Hive到Phoenix的数据交互

hive、oracle、phoenix常用函数对照表总结

hive、oracle、phoenix常用函数对照表

Sqoop通过Phoenix导hbase数据到hive

tw-hive:学习Hive API

node-hive:Node Hive客户端库

drake-hive:Drake 的 Hive 插件

ycdh-hive:YCDH蜂巢

homebridge-bee-hive：用于Homebridge的超级基本Hive插件

bing-tile-hive:Hing的Bing Tile支持

vim-hive:Hive 查询语言的语法文件

最新资源