客服电话练习:Hive查询与数据合并分析
148 浏览量
更新于2024-08-30
收藏 114KB PDF 举报
在本次客服电话练习中,我们使用Hive SQL语言进行数据处理和分析,涉及到的是两个模拟数据库表:call和sep。这两个表分别存储了客服电话的相关信息,如case_id、create_time、deal_name、deal_group以及feed_id、eva_end_time和sat_name等字段,它们都是通过逗号分隔的CSV格式文件加载到Hive中的。
首先,练习的目标是合并这两个表(join操作),只显示那些存在评价(sat_name非空)的记录。SQL查询语句如下:
```sql
SELECT a.case_id, a.create_time, a.deal_name, b.feed_id, b.eva_end_time, b.sat_name
FROM call a
INNER JOIN sep b
ON a.case_id = b.case_id
WHERE b.sat_name IS NOT NULL;
```
这个查询将call表与sep表按照case_id进行内连接,只保留那些在sep表中有评价结果(即sat_name不为空)的case_id。
接下来的练习是计算每个deal_name对应的总评价数量。通过子查询首先筛选出带有评价的记录,然后对deal_name进行分组并计数:
```sql
SELECT deal_name, COUNT(deal_name) AS zong
FROM (
SELECT a.case_id, a.create_time, a.deal_name, b.feed_id, b.eva_end_time, b.sat_name
FROM call a
INNER JOIN sep b
ON a.case_id = b.case_id
WHERE b.sat_name IS NOT NULL
) t1
GROUP BY deal_name;
```
这个查询返回每个deal_name的评价次数,作为总评价量。
最后,我们还想了解每个deal_name下的满意评价(sat_name为非空)的数量,为此又执行了一个子查询,并按deal_name和sat_name进行分组计数:
```sql
SELECT deal_name, sat_name, COUNT(sat_name) AS countsat
FROM (
SELECT a.case_id, a.create_time, a.deal_name, b.feed_id, b.eva_end_time, b.sat_name
FROM call a
INNER JOIN sep b
ON a.case_id = b.case_id
WHERE b.sat_name IS NOT NULL
) t1
GROUP BY deal_name, sat_name;
```
这个查询返回了每个deal_name下满意评价(sat_name非空)的具体数量。
这次练习涵盖了Hive SQL的基础操作,包括创建表、数据加载、表之间的连接(JOIN)、分组统计以及条件筛选,这些都是数据处理和数据分析中常见的技能。通过这些练习,可以巩固对Hive在实际业务场景中的应用能力。
2019-01-05 上传
2018-12-06 上传
2020-12-11 上传
2023-09-03 上传
2023-08-13 上传
2023-05-27 上传
2023-06-09 上传
2023-08-03 上传
2024-04-16 上传
weixin_38502428
- 粉丝: 6
- 资源: 886
最新资源
- C语言数组操作:高度检查器编程实践
- 基于Swift开发的嘉定单车LBS iOS应用项目解析
- 钗头凤声乐表演的二度创作分析报告
- 分布式数据库特训营全套教程资料
- JavaScript开发者Robert Bindar的博客平台
- MATLAB投影寻踪代码教程及文件解压缩指南
- HTML5拖放实现的RPSLS游戏教程
- HT://Dig引擎接口,Ampoliros开源模块应用
- 全面探测服务器性能与PHP环境的iprober PHP探针v0.024
- 新版提醒应用v2:基于MongoDB的数据存储
- 《我的世界》东方大陆1.12.2材质包深度体验
- Hypercore Promisifier: JavaScript中的回调转换为Promise包装器
- 探索开源项目Artifice:Slyme脚本与技巧游戏
- Matlab机器人学习代码解析与笔记分享
- 查尔默斯大学计算物理作业HP2解析
- GitHub问题管理新工具:GIRA-crx插件介绍