首页'<div class="price_m" id="original-price">\n' ' <span class="yen">¥</span>118.00 </div>',这种网页数据怎么使用python才能提取到文本内容

'<div class="price_m" id="original-price">\n' ' <span class="yen">¥</span>118.00 </div>',这种网页数据怎么使用python才能提取到文本内容

时间: 2024-04-15 15:31:00 浏览: 77

你可以使用 Python 中的 BeautifulSoup 库来提取网页数据中的文本内容。首先，你需要安装 BeautifulSoup 库，可以使用以下命令进行安装： ```python pip install beautifulsoup4 ``` 然后，你可以使用下面的代码来提取网页数据中的文本内容： ```python from bs4 import BeautifulSoup html = '<div class="price_m" id="original-price">\n' \ ' <span class="yen">¥</span>118.00 </div>' soup = BeautifulSoup(html, 'html.parser') text = soup.get_text(strip=True) print(text) ``` 这段代码将输出文本内容 `¥118.00`。首先，我们创建了一个 BeautifulSoup 对象，并将网页数据传递给它。然后，使用 `get_text()` 方法来提取所有的文本内容，并通过 `strip=True` 参数去除多余的空格和换行符。希望这对你有帮助！如果还有其他问题，请随时问我。

阅读全文