对csv文件一列进行词频统计
时间: 2023-12-31 11:07:05 浏览: 239
要对CSV文件中的一列进行词频统计,可以使用Pandas库来读取CSV文件,并使用Python中的`collections`库来实现词频统计。
假设CSV文件中的一列是`col_name`,我们可以使用Pandas库来读取该列:
```python
import pandas as pd
df = pd.read_csv('file.csv')
col = df['col_name']
```
接下来,可以使用字符串方法和`collections`库来计算每个单词的出现次数:
```python
from collections import Counter
words = ' '.join(col).lower().split()
word_counts = Counter(words)
```
最后,将结果写入CSV文件。可以使用`csv`库中的`writerow`方法来逐行写入数据:
```python
import csv
with open('word_counts.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['Word', 'Count'])
for word, count in word_counts.items():
writer.writerow([word, count])
```
完整代码如下:
```python
import pandas as pd
from collections import Counter
import csv
df = pd.read_csv('file.csv')
col = df['col_name']
words = ' '.join(col).lower().split()
word_counts = Counter(words)
with open('word_counts.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['Word', 'Count'])
for word, count in word_counts.items():
writer.writerow([word, count])
```
以上代码将CSV文件中的一列进行词频统计,并将结果写入CSV文件中的两列。
阅读全文