python统计文本中不同单词个数
时间: 2023-07-16 22:16:38 浏览: 68
可以用Python的字典来实现单词计数的功能,具体代码如下:
```python
text = "This is a sample text with several words and repeated words"
words = text.split() # 将文本划分成单词
word_count = {} # 创建一个空字典
# 遍历单词列表
for word in words:
if word not in word_count:
word_count[word] = 1 # 如果单词不在字典中,则将其加入字典,并将其计数设置为1
else:
word_count[word] += 1 # 如果单词已经在字典中,则将其计数加1
# 输出不同单词的个数
print("不同单词的个数:", len(word_count))
```
输出结果如下:
```
不同单词的个数: 9
```
这个代码可以统计文本中不同单词的个数,但是它并没有考虑到单词的大小写、标点符号等问题。如果需要更加精确的统计,还需要进行一些数据清洗的工作。
相关问题
python统计文本文件中不同单词个数
可以使用Python的字典来统计不同单词的个数。具体步骤如下:
1. 打开文本文件并读取文件内容。
2. 将文件内容按照空格进行分割,得到单词列表。
3. 遍历单词列表,对于每一个单词,判断是否已经在字典中出现过,如果出现过,则将对应的计数器加一,否则将该单词加入字典并初始化计数器为1。
4. 输出字典中的键值对,即不同单词和对应的个数。
示例代码如下:
```python
filename = input("请输入文件名:")
word_count = {}
with open(filename, 'r') as f:
for line in f:
words = line.split()
for word in words:
if word in word_count:
word_count[word] += 1
else:
word_count[word] = 1
for word, count in word_count.items():
print(word, count)
```
在运行代码时,需要输入要统计的文本文件名。代码会输出文件中不同单词及其出现的次数。
python统计文本中单词个数
可以通过Python的字符串操作和正则表达式来统计文本中单词的个数。下面是一个简单的实现:
```python
import re
def count_words(text):
words = re.findall(r'\w+', text.lower())
return len(words)
text = "Python是一种高级编程语言,被广泛应用于人工智能、数据科学等领域"
print(count_words(text)) # 输出 13
```
这里使用`re.findall()`函数来匹配文本中所有的单词,并将它们转换为小写字母形式。然后使用Python内置函数`len()`来获取单词数量。