pandas中的函数
时间: 2023-10-30 17:27:14 浏览: 104
在 Pandas 中有许多常用的函数可用于数据处理和分析。下面是一些常见的 Pandas 函数:
1. `read_csv()`:从 CSV 文件中读取数据并创建一个 DataFrame。
2. `head()`:显示 DataFrame 的前几行,默认为前 5 行。
3. `tail()`:显示 DataFrame 的后几行,默认为后 5 行。
4. `info()`:显示 DataFrame 的摘要信息,包括列名、非空值数量和数据类型等。
5. `describe()`:生成 DataFrame 中数值列的统计摘要,包括计数、均值、标准差、最小/最大值等。
6. `shape`:获取 DataFrame 的形状,即行数和列数。
7. `columns`:获取 DataFrame 的列名列表。
8. `values`:获取 DataFrame 中的所有值作为一个二维数组。
9. `loc[]`:通过标签选取行或列的子集。
10. `iloc[]`:通过索引选取行或列的子集。
11. `dropna()`:删除包含缺失值的行或列。
12. `fillna()`:用指定的值或方法填充缺失值。
13. `groupby()`:按照指定的列进行分组操作。
14. `sort_values()`:按照指定的列对 DataFrame 进行排序。
15. `merge()`:根据指定的列将两个 DataFrame 进行合并。
这只是一小部分 Pandas 中可用的函数,还有很多其他功能强大的函数可供使用。
相关问题
pandas duplicated函数
pandas中的duplicated函数是用来判断DataFrame或Series中的元素是否重复的函数。该函数返回一个布尔型的Series或DataFrame,其中True表示该元素是重复的,False表示该元素不是重复的。可以通过设置参数来指定判断重复的列或行。
pandas 日期函数
pandas日期函数主要包括Timestamp、day_name、Timedelta、date_range等。Timestamp函数用于输入日期并显示特定日期的名称,而day_name函数则是用来显示指定日期的名称。Timedelta函数用于进行日期的算术计算,可以实现日期的加减操作。date_range函数可以生成一个日期序列的范围,通过指定开始日期、结束日期和频率参数,可以获取该范围内的日期序列。这些日期函数在pandas中非常重要,可以方便地进行时间序列的处理与分析。
阅读全文