自己生成一个数据集，分别进行：空值、重复值、异常值的处理。生成一个多个数据集，进行数据的堆叠实验。

数据集：学生信息表 | 学生姓名 | 年龄 | 性别 | 学号 | 成绩 | | -------- | ---- | ---- | ---- | ---- | | 张三 | 18 | 男 | 001 | 95 | | 李四 | 19 | 女 | 002 | 87 | | 王五 | 17 | 男 | | 92 | | 小明 | 20 | 男 | 003 | 89 | | 李华 | | 男 | 004 | 91 | | 小红 | 18 | 女 | 005 | 96 | | 王二 | 20 | 男 | 006 | 82 | | 王三 | 19 | 男 | 007 | 94 | | 小李 | 21 | 男 | 008 | 88 | | 小张 | 18 | 女 | 009 | 90 | | 小刘 | 20 | 男 | 010 | 97 | | 王一 | 17 | 男 | 011 | | | 张四 | 19 | 男 | 012 | 93 | | 张五 | 18 | 女 | 013 | 85 | 空值处理： 1. 删除包含空值的行。例如，删除学号为null的行： ```sql DELETE FROM student WHERE 学号 IS NULL; ``` 2. 对于缺失的年龄和成绩，可以填入平均值。例如，将年龄缺失的学生的年龄填入平均年龄： ```sql UPDATE student SET 年龄 = (SELECT AVG(年龄) FROM student WHERE 年龄 IS NOT NULL) WHERE 年龄 IS NULL; ``` 重复值处理： 1. 删除重复值。例如，删除学号重复的行： ```sql DELETE FROM student WHERE 学号 IN (SELECT 学号 FROM student GROUP BY 学号 HAVING COUNT(*) > 1); ``` 2. 将重复值合并成一行。例如，将学号相同的学生的成绩求平均值： ```sql SELECT 学生姓名, 年龄, 性别, 学号, AVG(成绩) AS 成绩 FROM student GROUP BY 学号; ``` 异常值处理： 1. 删除异常值。例如，删除成绩小于60分的行： ```sql DELETE FROM student WHERE 成绩 < 60; ``` 2. 将异常值替换为正常值。例如，将成绩大于100分的学生的成绩修改为100分： ```sql UPDATE student SET 成绩 = 100 WHERE 成绩 > 100; ``` 数据堆叠实验：生成两个数据集，分别为学生信息表和学生选课信息表：学生信息表： | 学生姓名 | 年龄 | 性别 | 学号 | | -------- | ---- | ---- | ---- | | 张三 | 18 | 男 | 001 | | 李四 | 19 | 女 | 002 | | 王五 | 17 | 男 | 003 | | 小明 | 20 | 男 | 004 | | 李华 | 21 | 男 | 005 | | 小红 | 18 | 女 | 006 | | 王二 | 20 | 男 | 007 | | 王三 | 19 | 男 | 008 | | 小李 | 21 | 男 | 009 | | 小张 | 18 | 女 | 010 | 学生选课信息表： | 学号 | 课程名称 | 课程成绩 | | ---- | -------- | -------- | | 001 | 数学 | 95 | | 002 | 语文 | 87 | | 003 | 英语 | 92 | | 004 | 物理 | 89 | | 005 | 化学 | 91 | | 006 | 历史 | 82 | | 007 | 政治 | 94 | | 008 | 地理 | 88 | | 009 | 生物 | 90 | | 010 | 美术 | 97 | 将两个数据集堆叠在一起： ```sql SELECT 学生姓名, 年龄, 性别, student.学号, 课程名称, 课程成绩 FROM student JOIN course ON student.学号 = course.学号; ``` 得到的结果为： | 学生姓名 | 年龄 | 性别 | 学号 | 课程名称 | 课程成绩 | | -------- | ---- | ---- | ---- | -------- | -------- | | 张三 | 18 | 男 | 001 | 数学 | 95 | | 李四 | 19 | 女 | 002 | 语文 | 87 | | 王五 | 17 | 男 | 003 | 英语 | 92 | | 小明 | 20 | 男 | 004 | 物理 | 89 | | 李华 | 21 | 男 | 005 | 化学 | 91 | | 小红 | 18 | 女 | 006 | 历史 | 82 | | 王二 | 20 | 男 | 007 | 政治 | 94 | | 王三 | 19 | 男 | 008 | 地理 | 88 | | 小李 | 21 | 男 | 009 | 生物 | 90 | | 小张 | 18 | 女 | 010 | 美术 | 97 |

阅读全文

自己生成一个数据集，分别进行：空值、重复值、异常值的处理。 生成一个多个数据集，进行数据的堆叠实验。

相关推荐

训练自己的数据集

数据库实验，自己做的，很详细

训练自己的数据集1

生成一个数据集，分别进行：空值、重复值、异常值的处理。生成一个多个数据集，进行数据的堆叠实验

根据数据集生成统计图生成工具

ESSBASE操作与性能优化指南：计算脚本与异常处理

iReport空值与异常值处理：

【Vaex中的缺失数据处理】：应对空值和缺失数据的7大策略

Python数据清洗进阶：深度解析缺失值与异常值处理

Pandas数据分析秘技：3步快速处理缺失值和异常值

Python时间序列分析入门指南：处理缺失数据和异常值

【数据完整性关键】：Origin中的插补技术与异常值处理方法

Python数据分析实战：处理TCHIA 2-2018数据集

pyparsing与JSON数据处理：解析和生成JSON文件，轻松处理结构化数据

Python数据清洗秘技：深入异常检测与处理

【Python数据探索宝典】：双色球数据集解析与预测模型构建

YOLO车辆训练集中的异常值：处理方法与注意事项，避免模型训练受异常数据影响

【数据清洗艺术】：用Power Query清洗数据，准备干净数据集的黄金法则

使用Python进行红酒数据集可视化分析：视觉呈现的艺术

【红酒数据集探索性数据分析初探】：入门指南与实践技巧大揭秘

大家在看

2_JFM7VX690T型SRAM型现场可编程门阵列技术手册.pdf

网络信息系统应急预案-网上银行业务持续性计划与应急预案

RK eMMC Support List

DAQ97-90002.pdf

毕业设计&课设-MATLAB的光场工具箱.zip

最新推荐

Stata数据集缺省值的处理

蒸散发数据的处理及空间分析建模的学习

JDBC查询返回数据集一直为空，明明数据库(MySQL)有数据的解决办法

python数据预处理（1）———缺失值处理

使用Python Pandas处理亿级数据的方法

免费下载可爱照片相框模板

【IE11停用倒计时】：无缝迁移到EDGE浏览器的终极指南（10大实用技巧）

STC8H8K64U 精振12MHZ T0工作方式1 50ms中断 输出一秒方波

易语言中线程启动并传递数组的方法

【PCB设计速成】：零基础到专家的电路板设计全面攻略

自己生成一个数据集，分别进行：空值、重复值、异常值的处理。生成一个多个数据集，进行数据的堆叠实验。

STC8H8K64U 精振12MHZ T0工作方式1 50ms中断输出一秒方波