'<div class="price_m" id="original-price">\n' ' <span class="yen">¥</span>118.00 </div>',这种网页数据怎么使用python才能提取到文本内容
时间: 2024-04-15 11:31:00 浏览: 72
你可以使用 Python 中的 BeautifulSoup 库来提取网页数据中的文本内容。首先,你需要安装 BeautifulSoup 库,可以使用以下命令进行安装:
```python
pip install beautifulsoup4
```
然后,你可以使用下面的代码来提取网页数据中的文本内容:
```python
from bs4 import BeautifulSoup
html = '<div class="price_m" id="original-price">\n' \
' <span class="yen">¥</span>118.00 </div>'
soup = BeautifulSoup(html, 'html.parser')
text = soup.get_text(strip=True)
print(text)
```
这段代码将输出文本内容 `¥118.00`。首先,我们创建了一个 BeautifulSoup 对象,并将网页数据传递给它。然后,使用 `get_text()` 方法来提取所有的文本内容,并通过 `strip=True` 参数去除多余的空格和换行符。
希望这对你有帮助!如果还有其他问题,请随时问我。
阅读全文