hive sql使用
时间: 2024-06-20 13:00:19 浏览: 124
Hive与SQL优化.md
Hive是一个基于Hadoop的数据仓库工具,它允许使用类似SQL的查询语言HiveQL(HQL)来进行数据的分析和处理。下面是一些Hive SQL的使用介绍:
1.创建表格
使用Hive SQL可以创建表格并指定其列名、数据类型和其他属性。例如,以下是创建一个名为“sales”的表格的语句:
```
CREATE TABLE sales (
id INT,
product STRING,
price FLOAT,
sale_date STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
```
其中,ROW FORMAT DELIMITED和FIELDS TERMINATED BY ', '用于指定行和字段的分隔符,STORED AS TEXTFILE用于指定数据存储格式。
2.插入数据
可以使用INSERT语句向表格中插入数据。例如,以下是向“sales”表格中插入一条数据的语句:
```
INSERT INTO sales VALUES (1, 'product1', 100.0, '2021-01-01');
```
3.查询数据
可以使用SELECT语句查询表格中的数据。例如,以下是查询“sales”表格中所有数据的语句:
```
SELECT * FROM sales;
```
4.过滤数据
可以使用WHERE子句过滤查询结果。例如,以下是查询“sales”表格中价格大于50的记录的语句:
```
SELECT * FROM sales WHERE price > 50;
```
5.聚合数据
可以使用GROUP BY子句和聚合函数(如SUM、AVG等)对查询结果进行聚合。例如,以下是查询“sales”表格中每个产品销售总额的语句:
```
SELECT product, SUM(price) FROM sales GROUP BY product;
```
6.连接表格
可以使用JOIN子句连接多个表格。例如,以下是连接“sales”和“orders”两个表格并查询销售额大于订单额的记录的语句:
```
SELECT s.product, s.price, o.amount
FROM sales s JOIN orders o
ON s.product = o.product
WHERE s.price > o.amount;
```
以上是一些Hive SQL的使用介绍,希望能对你有所帮助。
阅读全文