首页“参考书目<\/p>”，在python中如何如何去除上述中的网页标签

“参考书目<\/p>”，在python中如何如何去除上述中的网页标签

时间: 2024-05-03 22:20:52 浏览: 174

可以使用正则表达式或是 beautifulsoup 库对 HTML 标签进行解析和过滤。下面是使用 beautifulsoup 的示例代码： ```python from bs4 import BeautifulSoup html = '参考书目<p>这是一段包含了网页标签的文字</p>' soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() print(text) ``` 输出结果为：参考书目这是一段包含了网页标签的文字这样就去除了 HTML 标签，只剩纯文本。

阅读全文