python 读取html文件特定文本
时间: 2023-10-26 19:22:29 浏览: 146
你可以使用 Python 的 BeautifulSoup 库来读取 HTML 文件中的特定文本。以下是一个简单的例子:
```python
from bs4 import BeautifulSoup
# 读取 HTML 文件
with open("example.html") as html_file:
soup = BeautifulSoup(html_file, "html.parser")
# 查找特定标签
title_tag = soup.title
# 获取标签文本
title_text = title_tag.get_text()
print(title_text)
```
在这个例子中,我们首先使用 `open` 函数读取 HTML 文件,并将其传递给 `BeautifulSoup` 对象。然后,我们使用 `soup.title` 查找 HTML 文件中的 `<title>` 标签,并使用 `get_text` 方法来获取标签中的文本。最后,我们将文本打印到控制台中。
阅读全文