pandas获取数据
时间: 2023-10-30 17:58:40 浏览: 118
要使用pandas获取数据,你可以使用pandas库中的一些函数和方法。以下是一些常用的方法:
1. 读取数据文件:
- `pd.read_csv('filename.csv')`:从CSV文件中读取数据。
- `pd.read_excel('filename.xlsx')`:从Excel文件中读取数据。
- `pd.read_sql('query', connection)`:从SQL数据库中读取数据。
2. 查看数据:
- `df.head(n)`:显示数据集的前n行,默认为5行。
- `df.tail(n)`:显示数据集的后n行,默认为5行。
- `df.shape`:显示数据集的行数和列数。
- `df.columns`:显示数据集的列名。
- `df.info()`:显示数据集的摘要信息。
3. 数据筛选和切片:
- `df[column]`:选择指定列的数据。
- `df[start:end]`:选择指定行范围的数据。
- `df.loc[row_indexer, column_indexer]`:通过标签名选择指定的行和列。
- `df.iloc[row_indexer, column_indexer]`:通过整数位置选择指定的行和列。
4. 数据操作和处理:
- `df.dropna()`:删除包含缺失值的行或列。
- `df.fillna(value)`:将缺失值填充为指定的值。
- `df.groupby(column)`:按照指定列进行分组。
- `df.sort_values(column)`:按照指定列的值进行排序。
- `df.merge(df2)`:将两个数据集按照共同的列进行合并。
这些只是pandas库中一小部分常用的函数和方法。你可以根据具体的需求和数据集来选择合适的函数进行数据获取和处理。
阅读全文