写一份HiveQL操作实践实验总结
时间: 2023-11-07 08:10:37 浏览: 115
好的,以下是我的总结:
Hive是基于Hadoop的数据仓库工具,它提供了类SQL语言(HiveQL)来查询和管理Hadoop中的数据。下面是一些常见的HiveQL操作实践:
1. 创建数据库和表:
创建数据库:
```
CREATE DATABASE my_database;
```
创建表:
```
CREATE TABLE my_table (
id INT,
name STRING,
age INT
);
```
2. 加载数据:
从本地文件系统加载数据:
```
LOAD DATA LOCAL INPATH '/path/to/local/file' INTO TABLE my_table;
```
从HDFS加载数据:
```
LOAD DATA INPATH '/path/to/hdfs/file' INTO TABLE my_table;
```
3. 查询数据:
查询所有数据:
```
SELECT * FROM my_table;
```
查询特定列:
```
SELECT id, name FROM my_table;
```
条件查询:
```
SELECT * FROM my_table WHERE age > 18;
```
4. 聚合操作:
COUNT操作:
```
SELECT COUNT(*) FROM my_table;
```
SUM操作:
```
SELECT SUM(age) FROM my_table;
```
GROUP BY操作:
```
SELECT name, COUNT(*) FROM my_table GROUP BY name;
```
5. 连接表:
内连接:
```
SELECT * FROM table1 JOIN table2 ON table1.id = table2.id;
```
左连接:
```
SELECT * FROM table1 LEFT JOIN table2 ON table1.id = table2.id;
```
右连接:
```
SELECT * FROM table1 RIGHT JOIN table2 ON table1.id = table2.id;
```
以上是一些常见的HiveQL操作实践,希望对你有所帮助。
阅读全文