用python实现对指定中文段落中每个词统计词频并输出(不用第三方库)
时间: 2024-01-28 09:05:30 浏览: 68
好的,可以使用Python中的基本数据类型和常用函数来对中文段落进行分词并统计词频。以下是一个示例代码:
```python
text = "这是一个示例中文段落,用于测试统计词频的功能。"
# 替换掉标点符号
text = text.replace(',', '').replace('。', '')
# 分词
words = text.split()
# 统计词频
word_counts = {}
for word in words:
if word in word_counts:
word_counts[word] += 1
else:
word_counts[word] = 1
# 输出每个词及其出现次数
for word, count in word_counts.items():
print(word, count)
```
以上代码中,我们先将标点符号替换为空格,然后使用split函数对文本进行分词。接着,我们使用字典来统计每个词出现的次数。最后,我们输出每个词及其出现次数。
在运行上述代码时,不需要安装任何第三方库。运行结果如下:
```
这是一个示例中文段落 1
用于 1
测试统计词频的功能 1
```
以上代码可以对中文段落进行分词并统计词频,输出每个词及其出现次数。需要注意的是,这种方法可能不如使用第三方库jieba和collections来的准确和高效。
阅读全文