python中DataFrame用法
时间: 2024-04-28 17:24:45 浏览: 205
DataFrame 是 pandas 库中的一个重要数据结构,用于存储和处理二维表格数据。以下是一些常见的 DataFrame 的用法示例:
1. 创建 DataFrame:
```python
import pandas as pd
# 从列表创建
data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
# 从字典创建
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 从 CSV 文件创建
df = pd.read_csv('data.csv')
```
2. 查看和处理 DataFrame 数据:
```python
# 查看前几行数据,默认为前5行
print(df.head())
# 查看列名
print(df.columns)
# 查看数据统计摘要
print(df.describe())
# 访问某一列
print(df['Name'])
# 添加新列
df['Gender'] = ['Female', 'Male', 'Male']
# 过滤数据
filtered_df = df[df['Age'] > 25]
# 排序数据
sorted_df = df.sort_values(by='Age')
# 删除某一列
df.drop('Gender', axis=1, inplace=True)
# 修改某一行的数据
df.loc[0, 'Age'] = 26
# 处理缺失值
df.dropna() # 删除含有缺失值的行
df.fillna(0) # 用 0 填充缺失值
```
3. 数据分组与聚合:
```python
# 分组并计算平均值
grouped_df = df.groupby('Gender').mean()
# 多个聚合函数
grouped_df = df.groupby('Gender').agg({'Age': ['mean', 'count']})
```
4. 数据的导入和导出:
```python
# 导出为 CSV 文件
df.to_csv('data.csv', index=False)
# 导出为 Excel 文件
df.to_excel('data.xlsx', index=False)
# 从 SQL 数据库导入数据
import sqlite3
conn = sqlite3.connect('data.db')
query = 'SELECT * FROM table_name'
df = pd.read_sql_query(query, conn)
```
这些只是 DataFrame 的一些常见用法,pandas 还提供了丰富的功能和方法,可以根据具体需求进行进一步学习和探索。
阅读全文