pd.DataFrame()创建空数据集然后添加数据
时间: 2024-09-24 19:01:30 浏览: 34
pandas.DataFrame 概念及创建
`pd.DataFrame()` 是pandas库中的一个函数,用于创建一个空的数据帧,它是Python处理表格数据的重要工具。当你需要初始化一个空的数据结构,并后续逐行或逐列添加数据时,可以使用这个函数。
首先,创建空数据集的基本语法如下:
```python
import pandas as pd
# 创建一个空的数据框,指定列名(默认无index)
df = pd.DataFrame()
```
这里,`df` 就是一个没有内容、仅包含列名的空数据帧。
如果你想要创建一个带有一列或多列固定长度的空数据框,可以指定列的名称和长度:
```python
# 指定列名和长度
column_names = ['Name', 'Age']
data_shape = (5, len(column_names)) # 例如,5行4列
df = pd.DataFrame(index=range(data_shape[0]), columns=column_names)
```
这将生成一个5行4列的空数据框,其中第一列是 'Name',第二列到第四列是 'Age'。
如果你想在之后添加数据,你可以直接像字典一样通过索引或列名插入新行:
```python
# 添加单行数据
row_data = {'Name': 'Alice', 'Age': 25}
df.loc[len(df)] = row_data
# 或者添加多行数据
rows_data = [{'Name': 'Bob', 'Age': 30}, {'Name': 'Charlie', 'Age': 35}]
df = df.append(rows_data, ignore_index=True)
```
每次添加完数据后,数据帧都会自动更新。
阅读全文