hadoop使用Hive创建表test(表属性有id、name、gender),往表中插入5条数据,查看插入的数据并统计男女性别各有多少人?
时间: 2024-10-12 13:16:54 浏览: 10
spark或mr引擎插入的数据,hive表查询数据为0
Hadoop生态系统中的Hive是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like查询语言 HiveQL 来管理大数据集。首先,我们可以创建一个名为 "test" 的表,其包含 id、name 和 gender 字段:
```sql
CREATE TABLE test (
id INT,
name STRING,
gender STRING
);
```
接下来,我们假设已经有五条预设的数据需要插入,可以用 INSERT INTO ... SELECT 语句来完成,这里以示例数据表示:
```sql
INSERT INTO TABLE test
SELECT 1, 'John Doe', 'Male' UNION ALL
SELECT 2, 'Jane Smith', 'Female' UNION ALL
SELECT 3, 'Alex Johnson', 'Male' UNION ALL
SELECT 4, 'Emily Brown', 'Female' UNION ALL
SELECT 5, 'Daniel Lee', 'Male';
```
然后,你可以使用 SQL 查询来查看已插入的数据:
```sql
SELECT * FROM test;
```
对于性别统计,可以使用 COUNT 函数配合 GROUP BY 子句:
```sql
SELECT gender, COUNT(*) as count
FROM test
GROUP BY gender;
```
这将返回每个性别的总人数。
阅读全文