用python爬虫爬取电影票房代码
时间: 2024-04-24 07:15:16 浏览: 305
电影天堂爬虫代码.zip
这里提供一个简单的电影票房爬虫示例,使用的是 requests 和 BeautifulSoup 库:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
# 设置要爬取的电影名称和对应的链接
movies = {'流浪地球': 'https://www.endata.com.cn/BoxOffice/MovieStock/movieShow.html?id=527830',
'复仇者联盟4:终局之战': 'https://www.endata.com.cn/BoxOffice/MovieStock/movieShow.html?id=522674',
'战狼2': 'https://www.endata.com.cn/BoxOffice/MovieStock/movieShow.html?id=492038'}
for movie, url in movies.items():
# 发送 GET 请求获取 HTML 页面
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
# 解析 HTML 页面,获取票房信息
box_office = soup.find('span', attrs={'id': 'piaofang'}).text
total_box_office = soup.find('span', attrs={'id': 'boxoffice'}).text
print('{}的票房为:{},总票房为:{}'.format(movie, box_office, total_box_office))
```
这个爬虫的实现十分简单,可以根据需要进行修改,例如添加更多的电影名称和链接。注意,爬取电影票房信息时需要注意反爬虫机制,可以设置请求头中的 User-Agent 等信息以模拟浏览器访问。
阅读全文