# (1) 读取 "datalstudent.xlsx" 文件,创建名为 "student" 的 DataFrame # (2) 随机显示 student 对象的 5 行数据 # (3) 查看 student 对象的列信息 # (4) 查看 student 对象的维度信息 # (5)访问 student 对象中行整数索引为2、列整数索引为1的数据元素 # (6)将 student 对象中的 ID 字段设置为索引字段 # (7)在 student 对象中查询姓名为“程伟”学生的信息 # (8)使用'成绩'列对 student 对象进行升序排序 # (9)使用'专业'列对 student 对象进行分组,创建名为 'student_group' 对象 # (10)使用 student_group 对象对'成绩'列计算平均值 # (11)以'姓名'列为子集,删除 student 对象中的重复值 # (12)统计 student 对象各列中缺失值的数量 # (13)统计 student 对象中各个专业学生数量
时间: 2024-03-23 16:39:07 浏览: 38
好的,让我来逐一回答你的问题:
(1) 读取 "datalstudent.xlsx" 文件,创建名为 "student" 的 DataFrame
```python
import pandas as pd
student = pd.read_excel('datalstudent.xlsx')
```
(2) 随机显示 student 对象的 5 行数据
```python
student.sample(5)
```
(3) 查看 student 对象的列信息
```python
student.columns
```
(4) 查看 student 对象的维度信息
```python
student.shape
```
(5) 访问 student 对象中行整数索引为2、列整数索引为1的数据元素
```python
student.iloc[2, 1]
```
(6) 将 student 对象中的 ID 字段设置为索引字段
```python
student.set_index('ID', inplace=True)
```
(7) 在 student 对象中查询姓名为“程伟”学生的信息
```python
student[student['姓名'] == '程伟']
```
(8) 使用'成绩'列对 student 对象进行升序排序
```python
student.sort_values(by='成绩')
```
(9) 使用'专业'列对 student 对象进行分组,创建名为 'student_group' 对象
```python
student_group = student.groupby('专业')
```
(10) 使用 student_group 对象对'成绩'列计算平均值
```python
student_group['成绩'].mean()
```
(11) 以'姓名'列为子集,删除 student 对象中的重复值
```python
student.drop_duplicates(subset='姓名', inplace=True)
```
(12) 统计 student 对象各列中缺失值的数量
```python
student.isnull().sum()
```
(13) 统计 student 对象中各个专业学生数量
```python
student['专业'].value_counts()
```
希望我的回答能够帮到你!
阅读全文