python对csv进行词频统计
时间: 2023-10-13 22:12:46 浏览: 207
好的,针对您的问题,您可以使用Python的csv和collections库来进行词频统计。具体代码如下:
```python
import csv
from collections import Counter
with open('example.csv','r', encoding='utf-8') as f: #将"example.csv"替换成你要读取的csv文件名
reader = csv.reader(f)
content = [row for row in reader]
words = []
for row in content:
words += row
word_counts = Counter(words)
print(word_counts.most_common())
```
以上代码可以读取csv文件中的所有内容,并使用Counter函数统计词频并输出结果。希望这个代码对您有所帮助。
相关问题
基于python将csv文件词频统计并将结果存入txt文件中
可以使用Python内置的csv和collections模块来进行词频统计,并使用Python内置的文件操作函数将结果存入txt文件中。以下是一个示例代码:
```python
import csv
from collections import Counter
# 读入csv文件
with open('data.csv', 'r') as f:
reader = csv.reader(f)
data = list(reader)
# 将所有单词合并成一个字符串
text = ' '.join([' '.join(row) for row in data])
# 将字符串按空格分割成单词列表
words = text.split()
# 使用Counter统计词频
word_counts = Counter(words)
# 将结果写入txt文件
with open('result.txt', 'w') as f:
for word, count in word_counts.most_common():
f.write('{} {}\n'.format(word, count))
```
其中,`data.csv`是需要统计的csv文件的文件名,`result.txt`是结果存入的txt文件的文件名。这段代码将读入csv文件中的所有单元格,将它们合并成一个字符串,然后按空格分割成单词列表,最后使用Counter统计每个单词出现的次数。然后,将结果写入txt文件中,每一行写入一个单词及其出现次数,用空格分隔。
python对分词后的csv进行词频统计
可以使用Python中的pandas和nltk包来对分词后的csv进行词频统计。使用pandas读取csv文件,然后利用nltk包进行分词和词频统计。具体实现可以参考以下代码:
```python
import pandas as pd
import nltk
# 读取csv文件
df = pd.read_csv('分词后的csv文件.csv', encoding='utf-8')
# 合并所有分词
words = []
for sentence in df['分词列名']:
words += sentence.split(',')
# 进行词频统计
fdist = nltk.FreqDist(words)
# 输出前10个高频词
for word, freq in fdist.most_common(10):
print("{}: {}".format(word, freq))
```
这样就可以对分词后的csv文件进行词频统计了,输出结果为前10个高频词。
阅读全文