Python爬取豆瓣电影票房
时间: 2023-11-05 21:02:42 浏览: 178
以下是一个简单的Python爬虫程序,可以爬取豆瓣电影的票房信息:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/chart'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find('table', class_='chart')
for tr in table.find_all('tr')[1:]:
td_list = tr.find_all('td')
rank = td_list[0].text.strip()
title = td_list[1].find('a').text.strip()
rating = td_list[2].text.strip()
box_office = td_list[3].text.strip()
print(f'{rank}\t{title}\t{rating}\t{box_office}')
```
这个程序首先发送一个HTTP请求到豆瓣电影票房榜的页面,然后使用BeautifulSoup库解析HTML代码。然后,程序找到票房榜的表格,循环遍历每一行,并提取排名、电影名称、评分和票房数据。最后,程序将这些数据打印出来。
需要注意的是,豆瓣电影网站有反爬机制,如果发送太多的请求,可能会被封IP。因此,建议设置一定的时间间隔,或者使用代理IP等方式进行爬取。
阅读全文