给定一个csv数据集,其中某个属性为类型,格式为a/b/c/…,利用python,写一个方法,实现对某类型不重复数量的统计
时间: 2023-06-25 09:05:53 浏览: 102
使用python编写GUI界面,实现对繁琐的csv表格文件进行指定的医生名字与药品名字的统计
假设csv文件名为"example.csv",类型所在的列名为"type",可以使用pandas库来读取csv文件并进行统计。
以下是一个示例代码:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv("example.csv")
# 统计各类型数量
type_counts = df["type"].value_counts()
# 输出某类型不重复数量
type_name = "a" # 需要统计的类型名
count = len(set(df[df["type"]==type_name]["id"]))
print(f"Type {type_name} has {count} unique counts.")
```
在以上代码中,使用pandas库中的`value_counts()`函数对所有类型进行数量统计,并将结果保存在`type_counts`变量中。若需要统计某个具体类型不重复数量,则可以使用`df[df["type"]==type_name]`筛选出该类型的所有记录,然后使用`set()`函数去重,最后使用`len()`函数获取不重复数量,并输出结果。
阅读全文