Hadoop安全配置:HiveServer2的Kerberos部署指南
需积分: 9 157 浏览量
更新于2024-09-09
1
收藏 19KB DOCX 举报
本文将介绍如何在Hadoop环境中利用Hive2进行安全部署,特别是通过Kerberos认证增强系统的安全性。
在Hadoop生态系统中,Hive是一个基于HDFS的数据仓库工具,它允许用户通过SQL-like语言(HQL)对存储在Hadoop上的大数据进行查询和分析。Hive 0.11版本引入了HiveServer1和HiveServer2,其中HiveServer2是设计用于提高性能和安全性的重要改进。虽然HiveServer1仍然保留以保持向后兼容性,但长期推荐使用HiveServer2。
配置HiveServer2监听端口和Host
为了设置HiveServer2监听特定的端口和主机,需要修改`hive-site.xml`配置文件。例如,可以将HiveServer2的Thrift端口设置为10000,并指定其绑定到的主机名为`test84.hadoop`:
```xml
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>test84.hadoop</value>
</property>
```
配置Kerberos认证
Kerberos是一种强大的身份验证协议,能提供互不信任网络环境中的安全服务。为了启用Kerberos认证,需要在`hive-site.xml`中设置以下属性:
```xml
<property>
<name>hive.server2.authentication</name>
<value>KERBEROS</value>
<description>
Client authentication types.
NONE: no authentication check
LDAP: LDAP/AD based authentication
KERBEROS: Kerberos/GSSAPI authentication
CUSTOM: Custom authentication provider
(Use with property hive.server2.custom.authentication.class)
</description>
</property>
<property>
<name>hive.server2.authentication.kerberos.principal</name>
<value>hadoop/_HOST@DIANPING.COM</value>
</property>
<property>
<name>hive.server2.authentication.kerberos.keytab</name>
<value>/etc/hadoop.keytab</value>
</property>
```
这里,`hive.server2.authentication`设置为`KERBEROS`,意味着客户端和HiveServer2之间的通信将通过Kerberos进行身份验证。`hive.server2.authentication.kerberos.principal`定义了服务主体名称,`_HOST`将被实际的主机名替换,`DIANPING.COM`是Kerberos的 Realm。`hive.server2.authentication.kerberos.keytab`则指定了服务器的keytab文件位置,该文件包含了服务主体的凭据。
设置Impersonation
为了确保数据访问的安全性,HiveServer2还可以配置为以提交查询的用户身份执行操作,这称为impersonation。默认情况下,如果未明确设置,Hive可能会以Hive服务自身的身份运行所有操作。开启impersonation可以通过设置`hive.server2.enable.doAs`属性:
```xml
<property>
<name>hive.server2.enable.doAs</name>
<value>true</value>
</property>
```
当这个属性设为`true`时,HiveServer2将模拟提交查询的用户权限,从而确保用户只能访问他们有权访问的数据。
通过上述配置,我们可以实现一个安全的Hadoop Hive环境,利用Kerberos认证保护数据访问,并通过impersonation确保用户权限的正确应用。这样的部署对于大型企业或组织来说尤其重要,因为它能够提供一个安全的平台来处理敏感和关键的数据。
2016-08-18 上传
659 浏览量
171 浏览量
251 浏览量
146 浏览量
2024-10-12 上传
2023-03-21 上传
bigdatajimmy
- 粉丝: 0
- 资源: 1
最新资源
- 2012年供电系统个人工作总结
- leetcode耗时-RCE-Pipeline:RCE-管道
- gulp:gulp打包工具,less转译压缩
- pandas-gbq-0.1.3.tar.gz
- ws-automate:使用Ansible在新的Debian(或Ubuntu)安装上快速设置Awesome WM和一些自定义配置
- ZhenhangTung.github.io:我的博客
- pandas-datareader-0.7.0.tar.gz
- leetcode耗时-LeetCode:许多LeetCode解决方案。为练习目的在C#中实现
- og-aws::orange_book:Amazon Web Services-实用指南
- 小学生值周工作总结
- 有道笔记PHP API (libNote) v1.0
- TableWidgetLoad.zip
- camtheman256.github.io:基于Next.js的新个人网站
- Utopia:不存在的完美语言
- leetcode耗时-LeetCode:来自LeetCode的各种问题
- cuisinierrebelle:Cuisinier Rebelle的官方网站!