python123词频统计V1
时间: 2023-11-04 13:06:59 浏览: 137
好的,我了解了你的要求。针对你的问题,我可以提供以下思路:
1. 首先读取文本文件,可以使用Python内置的open函数打开文件,然后使用read方法读取文件内容。
2. 将读取到的文本内容进行分词,可以使用Python中的jieba库进行中文分词。
3. 统计每个词出现的次数,可以使用Python中的字典进行统计。
4. 将统计结果按照词频从高到低排序,可以使用Python中的sorted函数进行排序。
相关问题
python123词频统计
好的,我可以帮您实现一个简单的Python程序来进行词频统计。请先确保您已经安装了Python环境。
首先,您需要准备一份文本文件,比如说叫做 "test.txt",里面包含了需要统计词频的内容。然后,您可以使用以下代码来实现词频统计:
```python
# 打开文件
with open('test.txt', 'r') as f:
# 读取文件内容并转换成小写
content = f.read().lower()
# 将非字母字符替换成空格
content = ''.join(c if c.isalpha() else ' ' for c in content)
# 将内容分割成单词列表
words = content.split()
# 统计每个单词出现的次数
word_count = {}
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
# 按照出现次数降序排序并输出结果
sorted_word_count = sorted(word_count.items(), key=lambda x: x[1], reverse=True)
for word, count in sorted_word_count:
print(word, count)
```
这段代码会输出每个单词以及它们在文本中出现的次数,按照出现次数的降序排列。您可以将文件名 "test.txt" 替换成您需要统计的文本文件名,然后执行代码即可。
python123白鹿原词频统计
在Python中,你可以使用内置的`collections`模块来对文本,如《白鹿原》的词频进行统计。首先,你需要读取文本文件并将其内容转换成字符串,然后利用`Counter`类计算每个词出现的次数。以下是一个简单的步骤示例:
```python
import re
from collections import Counter
# 读取文件
with open('白鹿原.txt', 'r', encoding='utf-8') as file:
text = file.read()
# 清理文本,去除标点、换行符等非字母字符,并转为小写
text = re.sub(r'[^\w\s]', '', text).lower()
# 分割单词
words = text.split()
# 使用Counter进行词频统计
word_counts = Counter(words)
# 打印前10个最常见的词及其频率
for word, freq in word_counts.most_common(10):
print(f'{word}: {freq}')
阅读全文