Python数据处理的基础命令函数
时间: 2024-09-25 22:00:32 浏览: 30
Python中有很多强大的库用于数据处理,如Pandas是最常用的数据分析工具。以下是几个基础的Pandas命令:
1. **读取数据**:
- `pandas.read_csv()`:从CSV文件加载数据。
- `pandas.read_excel()`:从Excel文件加载。
- `pandas.read_json()`:从JSON文件或在线资源加载数据。
2. **查看数据概览**:
- `df.head()`:显示数据框的前几行,默认5行。
- `df.tail()`:显示数据框的最后几行。
- `df.shape`:获取数据框的行数(行)和列数(列)。
3. **数据清洗**:
- `dropna()`:删除包含缺失值的行。
- `fillna()`:填充缺失值,可以指定默认值或采用其他方法填充。
4. **选择和过滤数据**:
- 列名选取:`df['column_name']`。
- 条件筛选:`df[df[column] > value]` 或 `df[(df[col_1] > val_1) & (df[col_2] < val_2)]`。
5. **统计信息**:
- `describe()`:计算各数值型列的基本描述性统计量。
- `groupby()`:按一列或多列分组,并对每个组应用聚合函数(如sum(), mean(), count()等)。
6. **排序数据**:
- `sort_values()`:按单列或多列排序。
7. **合并数据**:
- `merge()`:将两个或更多DataFrame按照某些键列合并。
- `concat()`:水平或垂直地合并数据。
阅读全文