pd.DataFrame怎么用
时间: 2024-09-27 12:00:22 浏览: 30
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
5星 · 资源好评率100%
`pd.DataFrame`是Pandas库中的重要数据结构,类似于SQL表或Excel表格,它是一个二维表格型的数据结构,用于存储和处理表格数据。DataFrame可以有行索引(index)和列索引(columns),支持多种数据类型的混合。
创建DataFrame的基本语法如下:
```python
import pandas as pd
# 使用列表或字典创建 DataFrame
data = {'Column1': [1, 2, 3], 'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)
# 或者从文件、数据库或网络读取数据
df = pd.read_csv('file.csv') # 读取CSV文件
```
你可以通过列名访问和修改数据,执行统计分析,以及对数据进行分组、排序等操作。例如:
```python
# 访问特定列
print(df['Column1'])
# 修改部分数据
df.loc[0, 'Column1'] = 4
# 数据统计
print(df.describe())
# 数据筛选
df[df['Column1'] > 2]
阅读全文