Python扫描网页各级title
时间: 2024-10-24 12:08:17 浏览: 27
在Python中,我们可以使用`requests`库来发送HTTP请求获取网页内容,然后利用`BeautifulSoup`库解析HTML文档,找到所有的`<title>`标签并提取其文本内容。下面是一个简单的步骤示例:
```python
import requests
from bs4 import BeautifulSoup
def scan_page_title(url):
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的<title>标签
titles = soup.find_all('title')
# 提取并打印title文本
for title in titles:
print(title.text.strip())
else:
print(f"Failed to fetch the page. Status code: {response.status_code}")
# 使用函数扫描特定页面
scan_page_title('https://www.example.com')
```
阅读全文