用python去除文本文件每行中‘<B>’与‘</B>’中间的内容,并删除'<U>'与‘</U>’
时间: 2023-11-27 20:51:55 浏览: 59
可以使用正则表达式来匹配需要删除的文本,然后再将其替换为空字符串即可。
以下是示例代码:
```python
import re
# 打开文件
with open('input.txt', 'r') as f:
lines = f.readlines()
# 定义正则表达式
pattern = re.compile(r'<B>.*?</B>|<U>|</U>')
# 遍历每行文本,删除需要删除的内容
for i in range(len(lines)):
lines[i] = re.sub(pattern, '', lines[i])
# 将处理后的文本写入新文件
with open('output.txt', 'w') as f:
f.writelines(lines)
```
上述代码会将 `input.txt` 文件中每行的 `<B>` 和 `</B>` 之间的内容以及 `<U>` 和 `</U>` 删除,并将处理后的文本写入 `output.txt` 文件中。
阅读全文