pandas获取一列数据的个数
时间: 2024-01-11 13:15:10 浏览: 257
可以使用 pandas 中的 value_counts() 函数来获取一列数据中每个值的个数,例如:
```python
import pandas as pd
# 创建一个示例数据
df = pd.DataFrame({'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']})
# 获取 'fruit' 列中每个值的个数
counts = df['fruit'].value_counts()
print(counts)
```
输出:
```
banana 3
apple 2
orange 1
Name: fruit, dtype: int64
```
其中,'fruit' 列中共有 3 个 'banana',2 个 'apple',1 个 'orange'。
相关问题
pandas 获取数据为空的个数
在Pandas中,你可以使用`isnull()`函数来检查数据框中的值是否为空,然后结合`sum()`函数来计算空值(包括NaN和None)的总数。这个操作通常用于数据清洗和预处理阶段,以了解数据的质量。
以下是一个简单的例子:
```python
import pandas as pd
# 假设df是一个Pandas DataFrame
df_with_nulls = df.isnull().sum()
# 这将返回一个Series,其中索引是DataFrame的列名,值是对应列中缺失值的数量
print(df_with_nulls)
```
`df_with_nulls` Series的每个非零值都表示该列中存在空值。如果你想得到整个数据框中空值的总数,可以对这个Series求和:
```python
total_nulls = df_with_nulls.sum().sum()
print(f"Total null values in the dataframe: {total_nulls}")
```
pandas查看某列数据分布
你可以使用pandas中的describe()函数来查看某列数据的分布情况。具体操作如下:
1. 首先导入pandas模块,并读取数据表:
```
import pandas as pd
data = pd.read_excel('产品统计表.xlsx')
```
2. 使用describe()函数查看某一列数据的分布情况,比如利润(元)列:
```
print(data['利润(元)'].describe())
```
输出结果将包括数据的个数(count)、均值(mean)、标准差(std)、最小值(min)、25%分位数(25%)、中位数(50%)、75%分位数(75%)和最大值(max)等信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [Python_Pandas_获取数据分布情况和相关系数](https://blog.csdn.net/feizuiku0116/article/details/119765309)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文