用python爬取电影票房数据
时间: 2023-10-09 12:06:48 浏览: 126
可以使用Python中的BeautifulSoup和Requests库进行网页爬取和解析。以下是一个爬取电影票房数据的示例代码:
```
import requests
from bs4 import BeautifulSoup
url = 'http://www.cbooo.cn/boxOffice/GetHourBoxOffice'
params = {
'num': '1',
'area': '50',
}
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3',
'Referer': 'http://www.cbooo.cn/',
}
response = requests.get(url=url, params=params, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')
data = soup.find('tbody')
movies = data.findAll('tr')
for movie in movies:
name = movie.find('td', {'class': 'text-left'}).text
box_office = movie.find('td', {'class': 'text-right'}).text
print(name, box_office)
```
这个示例代码使用了requests和BeautifulSoup库,先指定了网址和参数,同时加入了一些Headers信息进行反爬虫处理。接着使用requests库进行get请求,并得到响应的HTML文本。使用BeautifulSoup库解析HTML文本,获取我们需要的数据,即电影名与票房数据。最后将信息打印出来。
阅读全文