dataframe的方法
时间: 2023-12-03 09:12:46 浏览: 197
Pandas DataFrame Notes
DataFrame 是 Pandas 中用于处理表格数据的一种数据结构,它提供了很多方便的方法用于数据的处理和分析。以下是 DataFrame 常用的方法:
1. head(n):返回 DataFrame 的前 n 行数据,默认为前 5 行。
2. tail(n):返回 DataFrame 的后 n 行数据,默认为后 5 行。
3. info():打印 DataFrame 的基本信息,包括每列的数据类型、非空数量等。
4. describe():对 DataFrame 中的数值类型列进行统计描述,包括计数、均值、标准差、最小值、最大值、四分位数等。
5. shape:返回 DataFrame 的行数和列数。
6. columns:返回 DataFrame 的列名。
7. index:返回 DataFrame 的行索引。
8. loc[]:根据行标签和列标签选取数据,例如 df.loc[1, 'name'] 表示选取第一行的 name 列数据。
9. iloc[]:根据行索引和列索引选取数据,例如 df.iloc[1, 0] 表示选取第二行第一列的数据。
10. dropna():删除 DataFrame 中包含缺失值的行或列。
11. fillna():将 DataFrame 中的缺失值填充为指定的值。
12. groupby():对 DataFrame 中的数据进行分组,例如 df.groupby('gender').mean() 表示按照 gender 列进行分组并计算每组的均值。
13. merge():将两个 DataFrame 进行合并,例如 pd.merge(df1, df2, on='id') 表示按照 id 列将 df1 和 df2 合并成一个 DataFrame。
14. pivot():将 DataFrame 进行透视操作,例如 df.pivot(index='date', columns='city', values='temperature') 表示将 DataFrame 按照 date 列进行行分组,按照 city 列进行列分组,并将 temperature 列的值填充到相应的位置上。
除了以上方法,DataFrame 还提供了很多其他的方法,用于数据的筛选、排序、重塑等操作。
阅读全文