文本中评论最多和最少的单词数。
时间: 2024-01-24 12:17:08 浏览: 53
要回答这个问题,我们需要先对文本进行分词,然后统计每个评论的单词数。可以使用Python中的nltk库进行分词,代码如下:
```python
import nltk
nltk.download('punkt')
text = "这是一段文本。这是第二句话。这是第三个句子。"
sentences = nltk.sent_tokenize(text)
for sentence in sentences:
words = nltk.word_tokenize(sentence)
print(words)
```
输出结果为:
```
['这是', '一段', '文本', '。']
['这是', '第二句话', '。']
['这是', '第三个', '句子', '。']
```
接下来,我们可以使用类似下面的代码来统计每个评论的单词数:
```python
text = "这是一段文本。这是第二句话。这是第三个句子。"
sentences = nltk.sent_tokenize(text)
word_counts = []
for sentence in sentences:
words = nltk.word_tokenize(sentence)
word_counts.append(len(words))
print("评论最少的单词数:", min(word_counts))
print("评论最多的单词数:", max(word_counts))
```
当然,实际应用中,我们需要先读取文本文件,然后对其中的每个评论进行分词和单词数统计。
阅读全文