基于python的电影票房数据爬取与分析代码
时间: 2023-08-06 22:03:04 浏览: 135
以下是基于Python的电影票房数据爬取与分析代码:
爬取电影票房数据:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.cbooo.cn/year?year=2019"
# 发送请求
response = requests.get(url)
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 获取电影列表
movies = soup.select('.mov_con')[:10] # 只获取前10个电影
for movie in movies:
# 获取电影名称
name = movie.select_one('.mov_con p a').text
# 获取电影票房
box_office = movie.select_one('.boxoffice p span').text
print(name, box_office)
```
分析电影票房数据:
```python
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt
url = "https://www.cbooo.cn/year?year=2019"
# 发送请求
response = requests.get(url)
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 获取电影列表
movies = soup.select('.mov_con')[:10] # 只获取前10个电影
# 电影名称和票房列表
names = []
box_offices = []
for movie in movies:
# 获取电影名称
name = movie.select_one('.mov_con p a').text
# 获取电影票房
box_office = movie.select_one('.boxoffice p span').text
# 去掉票房中的“万”
box_office = float(box_office.replace('万', ''))
names.append(name)
box_offices.append(box_office)
# 绘制柱状图
plt.bar(names, box_offices)
# 设置x轴标签旋转角度
plt.xticks(rotation=45)
plt.show()
```
运行以上代码可以得到前10个电影的票房数据柱状图。
阅读全文