python pandas
时间: 2023-10-13 10:18:46 浏览: 71
python for pandas
Pandas是一个基于NumPy的库,用于数据操作和分析。它提供了大量的数据处理功能,例如数据清洗、数据转换、数据筛选、数据聚合等。它最常用的两个数据结构是Series和DataFrame。
Series是一维数组,可以存储不同类型的数据,每个元素都有一个索引。
DataFrame是二维表格,它由多个Series组成,每个Series对应一列,可以看作是一个Excel表格或SQL表。
Pandas还提供了许多数据的IO功能,能够读取和写入各种格式的数据,例如CSV、Excel、JSON、SQL等。
以下是使用pandas进行数据读取和简单操作的示例:
```python
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 查看前5行数据
print(df.head())
# 查看数据信息
print(df.info())
# 查看数据描述统计信息
print(df.describe())
# 选择一列数据
col = df['column_name']
# 选择多列数据
cols = df[['column_name1', 'column_name2']]
# 选择行数据
row = df.iloc[0]
# 选择多行数据
rows = df.iloc[0:5]
# 筛选数据
filtered = df[df['column_name'] > 0]
# 聚合数据
grouped = df.groupby('column_name').mean()
```
阅读全文