pandas库的常用命令
时间: 2024-06-28 22:01:10 浏览: 148
Pandas是Python中一个强大的数据处理库,它提供了一个灵活的数据结构DataFrame,用于数据清洗、转换、分析等操作。以下是一些常用的Pandas命令:
1. **数据读取**:
- `pd.read_csv(file_path)`:从CSV文件读取数据。
- `pd.read_excel(file_path)`:读取Excel文件。
- `pd.read_sql_query(sql, con)`:从SQL数据库查询数据。
2. **创建DataFrame**:
- `pd.DataFrame(data, index=None, columns=None)`:根据数据创建DataFrame。
- `pd.DataFrame({'column1': data1, 'column2': data2}, index=...)`:指定列和索引。
3. **查看数据**:
- `df.head()`:显示数据框的前几行。
- `df.tail()`:显示数据框的后几行。
- `df.info()`:显示数据的基本信息,包括每列的非空值数量等。
4. **数据清洗**:
- `df.dropna()`:删除含有缺失值的行或列。
- `df.fillna(value)`:填充缺失值。
- `df.replace(to_replace, value)`:替换特定值。
5. **数据选择与切片**:
- `df['column_name']`:选择单列数据。
- `df.iloc[row_index, column_index]`:按位置选择元素。
- `df.loc[row_label, column_label]`:按标签选择元素。
6. **数据操作**:
- `df.groupby('column')`:按列分组。
- `df.merge(df2, on='key', how='inner')`:合并数据。
- `df.sort_values(by='column')`:按某列排序。
7. **数据统计**:
- `df.describe()`:计算各数值列的统计摘要。
- `df.sum()`, `df.mean()`, `df.min()`, `df.max()`:计算各类统计量。
8. **数据透视表**:
- `df.pivot_table(values='value_column', index='index_column', columns='column_column')`:创建数据透视表。
阅读全文