用pycharm代码爬一下豆瓣电影的网页
时间: 2024-05-15 12:15:41 浏览: 12
以下是使用Python和BeautifulSoup库在豆瓣电影网站上爬取电影信息的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 豆瓣电影网站的URL
url = 'https://movie.douban.com/top250'
# 发送HTTP请求,获取网页内容
response = requests.get(url)
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.content, 'html.parser')
# 遍历每个电影节点,获取电影信息并打印
for movie in soup.select('.item'):
# 获取电影名称
title = movie.select_one('.title').text.strip()
# 获取电影评分
rating = movie.select_one('.rating_num').text.strip()
# 获取评价人数
rating_num = movie.select_one('.star span:nth-of-type(4)').text.strip()
# 获取电影描述
desc = movie.select_one('.inq').text.strip()
print(f'{title} | 评分:{rating} | 评价人数:{rating_num} | 描述:{desc}')
```
该代码使用了requests库发送HTTP请求,然后使用BeautifulSoup库解析HTML内容,并从中获取电影信息。最后,遍历每个电影节点并打印出电影名称、评分、评价人数和描述。