pd.DataFrame的用法
时间: 2024-10-24 08:01:28 浏览: 20
python pandas.DataFrame.loc函数使用详解
`pd.DataFrame`是Python pandas库中的核心数据结构,它是一个二维表格型的数据结构,类似于SQL表或Excel工作表。DataFrame允许存储不同类型的数据,并有列名标识各列,非常适合处理结构化数据。以下是`pd.DataFrame`的一些基本用法:
1. **创建DataFrame**:
- 从列表、字典、CSV文件、数据库等读取数据:
```python
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
```
2. **查看数据和结构**:
- 查看前几行: `df.head()`
- 查看数据摘要: `df.describe()`
3. **数据操作**:
- 添加新列: `df['NewColumn'] = values`
- 更新或删除列: `del df['ColumnName']`, `df['ColumnName'] = new_values`
4. **筛选数据**:
- 根据条件选择行: `df[df['Age'] > 30]`
- 使用布尔索引: `df[data['Gender'] == 'Male']`
5. **合并和分组**:
- 纵向堆叠: `df.groupby('Category').sum()`
6. **数据清洗**:
- 删除缺失值: `df.dropna()` 或 `df.fillna(value)`
阅读全文