DataFrame相应的操作方法
时间: 2023-11-03 11:17:05 浏览: 93
DataFrame 是 pandas 库中用于处理和分析数据的一个重要数据结构。下面是一些常用的 DataFrame 操作方法:
1. 创建 DataFrame:
- 使用字典创建:`df = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c']})`
- 从 NumPy 数组创建:`df = pd.DataFrame(np.array([[1, 2], [3, 4]]))`
- 从 CSV 文件导入:`df = pd.read_csv('data.csv')`
2. 查看 DataFrame:
- 查看前几行:`df.head()`
- 查看后几行:`df.tail()`
- 查看列名:`df.columns`
3. 选择和过滤数据:
- 按列选择:`df['col']` 或 `df.loc[:, 'col']`
- 按行选择:`df.loc[row_index]` 或 `df.iloc[row_number]`
- 条件过滤:`df[df['col'] > 5]`
4. 添加、删除和修改数据:
- 添加列:`df['new_col'] = [1, 2, 3]`
- 删除列:`del df['col']` 或 `df.pop('col')`
- 添加行:`df.loc[new_index] = [1, 'a']`
- 删除行:`df.drop(row_index)`
- 修改值:`df.loc[row_index, 'col'] = new_value`
5. 数据统计和计算:
- 统计描述:`df.describe()`
- 汇总统计:`df.sum()`, `df.mean()`, `df.max()`, `df.min()`
- 排序:`df.sort_values(by='col')`
- 分组聚合:`df.groupby('col').sum()`
这只是 DataFrame 操作的一部分,pandas 还提供了更多的功能和方法,可根据实际需求进行进一步学习和探索。
阅读全文