py csv文件统计重复项
时间: 2024-01-01 14:02:25 浏览: 35
要统计csv文件中的重复项,可以按以下步骤进行:
1. 导入`csv`模块:首先需要导入`csv`模块,以便读取和处理csv文件。
2. 打开csv文件:使用`open()`函数打开csv文件,指定文件路径和模式,通常是只读模式。
3. 创建csv阅读器:使用`csv.reader()`函数创建一个csv阅读器对象,将打开的文件对象作为参数传入。
4. 创建一个空列表:用于存储读取的csv文件中的数据。
5. 读取csv文件:使用`for`循环遍历阅读器对象,逐行读取csv文件,并将每行的数据追加到创建的空列表中。
6. 统计重复项:使用`collections`模块中的`Counter`函数统计列表中各项的出现次数,可以得到一个字典,其中键为列表中的项,值为对应项出现的次数。
7. 输出结果:按照需要的格式输出统计结果,可以使用`for`循环遍历字典中的键值对,并打印出来。
8. 关闭csv文件:使用`close()`函数关闭打开的csv文件。
示例代码如下:
```python
import csv
from collections import Counter
# 打开csv文件
with open('example.csv', 'r') as file:
# 创建csv阅读器
reader = csv.reader(file)
# 创建空列表
data = []
# 读取csv文件
for row in reader:
data.append(row)
# 统计重复项
counter = Counter(data)
# 输出结果
for item, count in counter.items():
print(f'{item}: {count}次')
# 关闭csv文件
file.close()
```
以上是使用Python统计csv文件中重复项的方法,可以根据具体的需求进行修改和扩展。