DataFrame基本操作 1、基于字典data构造一个DataFrame对象,并输出 data = {"int_column":[1,2,3,4],"float_column":[3.3,4.4,5.5,6.6],"string_column":['a','b','c','d']} 2、获取DataFrame对象的任意一列,并且查看其类型 3、给每一行设置行索引,分别是a1,a2,a3,a4 4、计算每列之和 5、分别使切片、iloc和loc三种方法输出前3行
时间: 2024-03-03 17:50:57 浏览: 113
1、基于字典data构造一个DataFrame对象,并输出:
```python
import pandas as pd
data = {"int_column":[1,2,3,4],
"float_column":[3.3,4.4,5.5,6.6],
"string_column":['a','b','c','d']}
df = pd.DataFrame(data)
print(df)
```
输出结果为:
```
int_column float_column string_column
0 1 3.3 a
1 2 4.4 b
2 3 5.5 c
3 4 6.6 d
```
2、获取DataFrame对象的任意一列,并且查看其类型:
```python
col = df['int_column']
print(col)
print(type(col))
```
输出结果为:
```
0 1
1 2
2 3
3 4
Name: int_column, dtype: int64
<class 'pandas.core.series.Series'>
```
3、给每一行设置行索引,分别是a1,a2,a3,a4:
```python
df.index = ['a1', 'a2', 'a3', 'a4']
print(df)
```
输出结果为:
```
int_column float_column string_column
a1 1 3.3 a
a2 2 4.4 b
a3 3 5.5 c
a4 4 6.6 d
```
4、计算每列之和:
```python
sums = df.sum()
print(sums)
```
输出结果为:
```
int_column 10
float_column 19.8
string_column abcd
dtype: object
```
5、分别使切片、iloc和loc三种方法输出前3行:
```python
# 切片方法
print(df[:3])
# iloc方法
print(df.iloc[:3])
# loc方法
print(df.loc['a1':'a3'])
```
输出结果为:
```
int_column float_column string_column
a1 1 3.3 a
a2 2 4.4 b
a3 3 5.5 c
int_column float_column string_column
a1 1 3.3 a
a2 2 4.4 b
a3 3 5.5 c
int_column float_column string_column
a1 1 3.3 a
a2 2 4.4 b
a3 3 5.5 c
```
阅读全文