python编写一个能找出两段英文文本中同时出现的单词的小程序。
时间: 2024-10-10 07:15:21 浏览: 64
在Python中,我们可以使用集合(set)的数据结构来实现这个功能。以下是简单的步骤:
首先,我们需要两个函数,一个用于提取给定文本中的所有单词(忽略标点符号),另一个用于比较两个集合的交集。
```python
import re
def extract_words(text):
# 使用正则表达式去除标点并分割成单词列表
words = re.findall(r'\b\w+\b', text.lower())
return set(words)
def find_common_words(text1, text2):
# 提取两个文本中的单词,然后求交集
word_set1 = extract_words(text1)
word_set2 = extract_words(text2)
common_words = word_set1 & word_set2
return common_words
# 测试示例
text1 = "Hello, world! This is a test."
text2 = "World is a big place, testing is important."
common = find_common_words(text1, text2)
print(f"Common words in both texts: {list(common)}")
```
在这个程序中,我们先将输入的文本转换为小写,并使用正则表达式`r'\b\w+\b'`匹配单词。然后,我们将每个文本的单词存储在各自的集合中,最后通过`&`操作符获取两个集合的交集,即同时出现在两段文本中的单词。
阅读全文