pandas,pd.DataFrame参数
时间: 2023-07-21 21:30:19 浏览: 94
pandas 是 Python 中一个非常流行的数据处理库,它提供了一个名为 DataFrame 的数据结构,用于处理表格数据。下面是 pd.DataFrame 的常用参数:
- data:DataFrame 的数据源,可以是 list、dict、ndarray 等。
- index:行索引,可以是 list、array、range 等,长度必须与数据源的行数相同。
- columns:列索引,可以是 list、array 等,长度必须与数据源的列数相同。
- dtype:数据类型,可以是 dict 或者 Series,指定每一列的数据类型。
- copy:是否复制数据源,默认为 False,即不复制,直接使用原数据源。
- columns.name:列索引的名称。
- index.name:行索引的名称。
例如,创建一个 DataFrame:
```python
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M']
}
df = pd.DataFrame(data)
print(df)
```
输出结果为:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
```
其中,data 参数为一个字典,字典的 key 是列名,value 是列的数据。由于没有指定行索引和列索引,所以默认使用了从 0 开始的整数索引。
阅读全文