首页python检查word文档的连续重复字，例如“用户的的资料”或“需要需要用户输入”之类的情况.(使用两种方法，其中一种为正则表达式)

python检查word文档的连续重复字，例如“用户的的资料”或“需要需要用户输入”之类的情况.(使用两种方法，其中一种为正则表达式)

时间: 2024-03-17 07:46:38 浏览: 43

请注意，这是您之前提出的问题，我已经回答了。以下是我先前的答案：方法一：使用Python的正则表达式模块re ```python import re import docx doc = docx.Document('example.docx') pattern = re.compile(r'(\b\w+\b)\s+\1') for para in doc.paragraphs: matches = pattern.findall(para.text) if matches: print(f"重复单词出现在段落 '{para.text}' 中") ``` 这里使用正则表达式来匹配重复的单词。`\b\w+\b` 匹配一个单词，`\s+` 匹配一个或多个空格，`\1` 匹配前面那个单词。方法二：使用Python的字符串方法 ```python import docx doc = docx.Document('example.docx') for para in doc.paragraphs: words = para.text.split() for i in range(len(words)-1): if words[i] == words[i+1]: print(f"重复单词 '{words[i]}' 出现在段落 '{para.text}' 中") ``` 这里使用字符串的 `split()` 方法将段落分成单词，然后遍历单词列表，如果相邻两个单词相同，则说明有重复单词。

阅读全文