Hive数据模型操作的数据查询操作,并加上代码实现
时间: 2024-06-11 11:04:36 浏览: 133
Hive中查询操作
5星 · 资源好评率100%
Hive是一个基于Hadoop的数据仓库工具,它可以将结构化数据映射到Hadoop的分布式文件系统中,并提供类SQL的查询语言HiveQL来查询数据。下面是Hive数据模型操作的数据查询操作的代码实现:
1. 创建表
在Hive中,可以使用CREATE TABLE语句创建表。例如,以下代码创建了一个名为student的表,其中有三个列:id(整数类型)、name(字符串类型)和age(整数类型)。
```
CREATE TABLE student (
id INT,
name STRING,
age INT
);
```
2. 插入数据
使用INSERT INTO语句向Hive表中插入数据。例如,以下代码向student表中插入了一行数据。
```
INSERT INTO student VALUES (1, 'Alice', 20);
```
3. 查询数据
使用SELECT语句查询Hive表中的数据。例如,以下代码查询student表中所有行的数据。
```
SELECT * FROM student;
```
4. 条件查询
使用WHERE子句在Hive表中查询满足条件的数据。例如,以下代码查询student表中年龄大于等于18岁的学生的信息。
```
SELECT * FROM student
WHERE age >= 18;
```
5. 聚合查询
使用GROUP BY和聚合函数(如SUM、AVG、COUNT等)对Hive表中的数据进行聚合查询。例如,以下代码查询student表中每个年龄段的学生数量和平均年龄。
```
SELECT age, COUNT(*) AS count, AVG(age) AS avg_age
FROM student
GROUP BY age;
```
阅读全文