Hadoop 2.6.0与Snappy集成安装与配置教程

125 浏览量更新于2024-09-10 收藏 132KB DOC 举报

本篇文章主要介绍了如何在Hadoop2.6.0环境下集成Snappy压缩算法，以提高数据处理性能。首先，我们从以下几个关键步骤来详细讲解： 1. **Snappy的安装配置**： - 下载Snappy源码：Snappy是一个高效的压缩库，可以从Google的Code仓库下载最新版本（如snappy-1.2.1.tar.gz），建议使用CDH发行版以避免兼容性问题。 - 安装过程：解压后，进入源码目录，进行配置（./configure），编译（make）和安装（make install）。默认安装位置是/usr/local/lib，通过`ls -lh`和grep命令确认Snappy已成功安装。 2. **Hadoop 2.6.0的编译**： - 准备工作：为了编译Hadoop，你需要下载Apache Ant、Apache Maven、FindBugs等依赖工具。同时，由于protobuf的安装需要C++编译器，比如gcc，因此先确保gcc及相关工具已经安装。 - 下载所需包：包括hadoop-2.6.0-src.tar.gz、protobuf-2.5.0.tar.gz等，并使用`tar`命令解压。 - 编译Hadoop：按照官方文档的指导，配置编译参数，编译Hadoop源代码，然后打包生成可执行文件。 3. **修改Hadoop配置**： - 修改核心配置文件（hadoop-env.sh），可能需要调整环境变量以指向Snappy库。 - 对core-site.xml和mapred-site.xml进行相应的配置，以便Hadoop能识别和利用Snappy压缩。 4. **验证集成**：完成上述步骤后，需要验证Hadoop是否正确地使用了Snappy。可以通过运行Hadoop任务并观察压缩数据的性能提升来验证。通过这些步骤，读者可以将自己的Hadoop集群与Snappy集成，从而在大数据处理过程中实现数据的高效压缩，提高系统的整体性能。注意，在实际操作中，可能需要根据具体的环境和需求对步骤进行微调，特别是对于不同版本的Hadoop或Snappy可能存在差异。

Hadoop2.6.0 编译和 snappy 安装配置文档
一、 snappy 安装配置........................................................................................................................1
1.1、下载源码............................................................................................................................1
1.2、编译安装............................................................................................................................1
二、 编译 hadoop2.6.0.......................................................................................................................1
2.1、下载所需的包并安装........................................................................................................2
2.2、安装编译所需的库............................................................................................................3
2.3、修改编译参数....................................................................................................................3
2.4、编译打包............................................................................................................................4
三、 修改 Hadoop 的配置参数.........................................................................................................5
3.1、修改 hadoop-env.sh............................................................................................................5
3.2、修改 core-site.xml..............................................................................................................5
3.3、修改 mapred-site.xml.........................................................................................................5
四、 验证............................................................................................................................................5
备注：建议用 CDH 发行版，原生的在兼容性上会存在问题
一、snappy 安装配置
1.1、下载源码
http://code.google.com/p/snappy/!
1.2、编译安装
将下载的 snappy-1.2.1.tar.gz 上传到 /opt 目录下
cd /opt
tar -zxvf snappy-1.2.1.tar.gz
cd /snappy-1.2.1
./configure
make
make install
默认是安装到 /usr/local/lib!, 执行 ls -lh /usr/local/lib |grep snappy 看到如下信息
二、编译 hadoop2.6.0

下载后可阅读完整内容，剩余4页未读，立即下载

czm20036

粉丝: 1
资源: 3

Hadoop 2.6.0与Snappy集成安装与配置教程

Hadoop集成snappy压缩快速下载使用指南

离线Hadoop集群Snappy压缩算法安装与HBase配置详解

Centos7上安装配置Hadoop 3.3.0并集成Snappy压缩

Hadoop HBase 配置 安装 Snappy 终极教程

hadoop2.5.0 snappy编译jar包

hadoop-snappy的java包

hadoop-snappy-0.0.1-SNAPSHOT

Hadoop集群上Snappy压缩算法的安装配置

hadoop-snappy-0.0.1-SNAPSHOT.tar.gz

编译Hadoop 2.7.4集成Snappy压缩：详细步骤

最新资源

Hadoop HBase 配置安装 Snappy 终极教程