利用DataFrame()方法新建数据,该数据包含10名学生的姓名、年龄和性别,并储存在文件中。(1)分别利用head预览前几行,利用shape获取数据表的大小,利用info获取数据类型,利用describe获取数据分布情况。(2)修改行索引为汉字;设置“姓名”为行索引;重置索引
时间: 2024-03-26 09:41:39 浏览: 70
好的,以下是针对你的问题的代码实现:
```python
import pandas as pd
# 定义数据
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十', '郑华', '陈龙'],
'年龄': [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
'性别': ['男', '男', '男', '女', '女', '男', '女', '男', '男', '女']}
# 利用DataFrame()方法新建数据
df = pd.DataFrame(data)
# 将数据储存在文件中
df.to_csv('students.csv', index=False)
# 预览前几行
print(df.head())
# 获取数据表的大小
print(df.shape)
# 获取数据类型
print(df.info())
# 获取数据分布情况
print(df.describe())
# 修改行索引为汉字
df.index = ['第一位', '第二位', '第三位', '第四位', '第五位', '第六位', '第七位', '第八位', '第九位', '第十位']
print(df)
# 设置姓名为行索引
df = df.set_index('姓名')
print(df)
# 重置索引
df = df.reset_index()
print(df)
```
输出结果如下:
```
姓名 年龄 性别
0 张三 20 男
1 李四 21 男
2 王五 22 男
3 赵六 23 女
4 钱七 24 女
(10, 3)
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 姓名 10 non-null object
1 年龄 10 non-null int64
2 性别 10 non-null object
dtypes: int64(1), object(2)
memory usage: 368.0+ bytes
None
年龄
count 10.000000
mean 24.500000
std 3.027650
min 20.000000
25% 22.250000
50% 24.500000
75% 26.750000
max 29.000000
姓名 年龄 性别
第一位 张三 20 男
第二位 李四 21 男
第三位 王五 22 男
第四位 赵六 23 女
第五位 钱七 24 女
第六位 孙八 25 男
第七位 周九 26 女
第八位 吴十 27 男
第九位 郑华 28 男
第十位 陈龙 29 女
年龄 性别
姓名
张三 20 男
李四 21 男
王五 22 男
赵六 23 女
钱七 24 女
孙八 25 男
周九 26 女
吴十 27 男
郑华 28 男
陈龙 29 女
姓名 年龄 性别
0 张三 20 男
1 李四 21 男
2 王五 22 男
3 赵六 23 女
4 钱七 24 女
5 孙八 25 男
6 周九 26 女
7 吴十 27 男
8 郑华 28 男
9 陈龙 29 女
```
阅读全文