python编写代码检查word文档的连续重复字,例如“用户的的资料”或“需要需要用户输入”之类的情况.(使用两种方法,其中一种为正则表达式)
时间: 2024-03-17 13:46:30 浏览: 96
方法1:使用字符串操作
```python
def check_duplicate_words(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
words = content.split()
for i in range(1, len(words)):
if words[i] == words[i-1]:
print("Duplicate word found: ", words[i])
```
其中,file_path是要检查的Word文档路径。这个函数会读取文档内容,将其分割成单词,并逐个比较相邻的单词是否相同,如果相同则输出重复的单词。
方法2:使用正则表达式
```python
import re
def check_duplicate_words_regex(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
pattern = r'\b(\w+)\s+\1\b'
duplicate_words = re.findall(pattern, content)
for word in duplicate_words:
print("Duplicate word found: ", word)
```
其中,file_path是要检查的Word文档路径。这个函数会读取文档内容,并使用正则表达式查找连续重复的单词。如果找到了连续重复的单词,则输出这些单词。
这两种方法都可以检查Word文档中的连续重复字。其中,第二种方法使用了正则表达式,可以更方便地查找连续重复的单词。
阅读全文