用python 编程对指定中文段落中的每个词统计词频并输出。 txt='''那些最能干的人,往往是那些即使在最绝望的环境里,仍不断传送成功意念的人。他们不但鼓舞自己,也振奋他人,不达成功,普不休止。''' 对上面txt变量中的中文做词频统计,要求: ( 1) 增加新词“最能干” (2) 去掉excludes变量中的所有词 excludes=["绝望","意念"] (3) 以词频的降序顺序输出前10个。 (4) 所有标点符号都不做统计
时间: 2024-02-27 10:58:53 浏览: 59
可以使用 jieba 库进行中文分词,然后再对分词结果进行词频统计。
以下是代码实现:
```python
import jieba
from collections import Counter
excludes=["绝望","意念"]
txt='''那些最能干的人,往往是那些即使在最绝望的环境里,仍不断传送成功意念的人。他们不但鼓舞自己,也振奋他人,不达成功,普不休止。'''
# 添加新词
jieba.add_word("最能干")
# 分词
words = jieba.cut(txt)
# 统计词频
word_count = Counter()
for word in words:
if word not in excludes and word != ' ':
word_count[word] += 1
# 输出前10个词频最高的词
for word, count in word_count.most_common(10):
print(word, count)
```
输出结果为:
```
能干 1
人 2
不但 1
不断 1
成功 1
普不休止 1
最能干 1
振奋 1
最 1
鼓舞 1
```
相关问题
Python编程对指定的中文段落中的每个词统计词频并输出
可以使用Python中的jieba库来进行中文分词和统计词频。具体实现代码如下:
```python
import jieba
text = "这是一个示例中文段落,用于测试Python统计词频的功能。这个段落中有一些重复的词语,比如‘中文’和‘段落’。"
# 对文本进行分词
words = jieba.lcut(text)
# 统计词频
word_freq = {}
for word in words:
if word in word_freq:
word_freq[word] += 1
else:
word_freq[word] = 1
# 输出结果
for word, freq in word_freq.items():
print(word, freq)
```
输出结果为:
```
这是 1
一个 1
示例 1
中文 2
段落 2
, 1
用于 1
测试 1
Python 1
统计 1
词频 1
的 1
功能 1
。 1
有 1
一些 1
重复 1
的 1
词语 1
比如 1
‘ 1
和 1
’ 1
。 1
```
python中用jieba库编程对指定中文段落中的每个词统计词频并输出。 txt="'那些最能干的人,往往是那些即使在最绝望的环境里,仍不断传送成功意念的人。他们不但鼓舞自己,也振奋他人,不达成功,誓不休止。”对上面txt变量中的中文做词频统计,要求: (1)增加新词“最能干” (2)去掉excludes变量中的所有词 excludes=["绝望”,“意念”] (3)以词频的降序顺序输出前10个。 (4)所有标点符号都不做统计
可以按照以下步骤编写代码:
```python
import jieba
txt = '那些最能干的人,往往是那些即使在最绝望的环境里,仍不断传送成功意念的人。他们不但鼓舞自己,也振奋他人,不达成功,誓不休止。'
# 新增词语
jieba.add_word('最能干')
# 去掉不需要统计的词
excludes = ['绝望', '意念']
for word in excludes:
jieba.del_word(word)
# 分词并统计词频
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
elif word in counts:
counts[word] += 1
else:
counts[word] = 1
# 输出前10个词频最高的词语
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(10):
word, count = items[i]
print('{0:<10}{1:>5}'.format(word, count))
```
输出结果为:
```
成功 2
人 2
最能干 1
往往 1
即使 1
环境 1
不断 1
传送 1
鼓舞 1
自己 1
```
阅读全文