加上使用pandas至少三个内置函数
时间: 2024-09-17 21:00:41 浏览: 45
Python pandas怎么使用.docx
Pandas是Python中强大的数据分析库,提供了许多内置函数,以下是一些常用的功能:
1. **`read_csv()`**:读取CSV文件。例如,你可以通过这个函数从本地文件或网络地址加载数据到DataFrame中。
```python
df = pd.read_csv('file.csv')
```
2. **`head()`**:查看数据框的前几行,默认显示前5行。这对于快速检查数据的基本结构很有帮助。
```python
print(df.head())
```
3. **`describe()`**:提供统计摘要信息,包括计数、平均值、标准差、最小值、四分位数和最大值,适用于数值列。
```python
summary_stats = df.describe()
print(summary_stats)
```
4. **`groupby()`**:按一列或多列进行分组,常用于聚合操作,比如求和、平均、计数等。
```python
group_summary = df.groupby('column_name').mean() # 求每组的平均值
```
5. **`merge()` or `join()`**:合并两个DataFrame,可以根据共享的键列(如索引或列名)连接它们。
```python
merged_df = pd.merge(df1, df2, on='common_column')
```
6. **`fillna()`**:填充缺失值,可以选择特定值、前一项值或后一项值替换缺失值。
```python
df['column_name'].fillna(value_to_fill, inplace=True)
```
以上仅是Pandas中的一部分功能,实际应用中还有很多其他函数,如筛选数据(`loc`和`iloc`)、排序(`sort_values`)、数据清洗(`dropna`)等。
阅读全文