从指定URL解析网页内容(代码及运行结果复制到下方空白)URL:(http://www.datawh.cn/zhanlang2.html)
时间: 2024-10-21 08:11:36 浏览: 27
基于Python的豆瓣中文影评差评分析.zip
5星 · 资源好评率100%
获取网页内容通常需要使用网络爬虫技术以及像Python的BeautifulSoup库这样的工具来处理HTML。这是一个基本的Python示例,使用requests库下载网页内容,然后使用BeautifulSoup解析它:
```python
import requests
from bs4 import BeautifulSoup
# 指定的URL
url = "http://www.datawh.cn/zhanlang2.html"
# 使用requests库发送GET请求
response = requests.get(url)
# 确保请求成功
if response.status_code == 200:
# 将响应文本转化为BeautifulSoup对象
soup = BeautifulSoup(response.text, 'html.parser')
# 打印页面标题(假设在<head>部分)
title = soup.title.string
print("页面标题:", title)
# 打印所有段落(<p>标签)
paragraphs = soup.find_all('p')
for p in paragraphs:
print(p.get_text())
else:
print(f"请求失败,状态码:{response.status_code}")
```
请注意,这个例子会打印出页面的标题和所有段落的内容,实际的结果会因目标网站的具体结构而变化。运行这段代码前,确保已经安装了`requests`和`beautifulsoup4`库,如果没有可以使用以下命令安装:
```bash
pip install requests beautifulsoup4
```
阅读全文