统计一个english.txt中出现的单词及其出现的次数并存入CSV文件
时间: 2024-12-08 07:14:13 浏览: 23
统计英文文本文件"english.txt"中每个单词及其出现次数,并将结果保存到CSV文件,可以按照以下步骤操作:
1. **读取文本文件**:首先,你需要使用Python的内置模块`open()`打开文件,然后逐行读取内容。
```python
with open('english.txt', 'r') as file:
text = file.read().lower() # 将所有内容转为小写以便统计算法不受大小写影响
```
2. **分词处理**:使用正则表达式或`re`库对文本进行分割,获取单词列表。
```python
import re
words = re.findall(r'\b\w+\b', text)
```
3. **创建字典存储频率**:遍历单词列表,使用字典存储每个单词及其出现次数。
```python
word_count = {}
for word in words:
if word not in word_count:
word_count[word] = 1
else:
word_count[word] += 1
```
4. **保存至CSV**:最后,你可以使用`csv`模块将字典内容写入CSV文件。
```python
import csv
def write_to_csv(data, filename):
with open(filename, 'w', newline='') as csvfile:
writer = csv.writer(csvfile)
writer.writerow(['Word', 'Frequency'])
for word, count in data.items():
writer.writerow([word, count])
write_to_csv(word_count, 'word_counts.csv')
```
完成以上步骤后,你就得到了一个名为`word_counts.csv`的CSV文件,其中包含单词和它们各自的出现次数。
阅读全文