首页text = re.sub(r'<[^>]+>', '', text)什么意思

text = re.sub(r'<[^>]+>', '', text)什么意思

时间: 2024-01-21 07:05:05 浏览: 64

re.sub()中的 r’\1\2\3\数字’ 还不知道是什么意思?这里有答案！！

步入正题之前，先来看一下re.sub()函数的功能演示： import re text = 'Jame 12 years old' pattern = r'[A-Z]\w+\s\d{1,2}' # 正则，匹配出名字和年龄 result = re.sub(pattern,'hello',text) # 将匹配出的内容替换为hello print(text) #打印原来的文本 print(result) # 打印替换后的文本 >>>Jame 12 years old >>>hello years old 显而易见，pattern从text中匹配到的内容”Jame 12“被中间的字符串即hel

这行代码使用了Python中的re模块，是用来处理字符串中的正则表达式的。它的作用是将text字符串中所有的HTML标签（比如<p>、<div>等）都去掉，只保留文本内容。具体来说，代码中使用的正则表达式<r'<[^>]+>'>可以匹配任何以<开头、以>结尾的字符串，从而将其替换为空字符串，即去掉这些HTML标签。

阅读全文