爬取猫眼电影top100
时间: 2023-11-20 08:06:51 浏览: 119
爬取猫眼Top100
好的,您可以使用 Python 语言和 requests、BeautifulSoup 库来爬取猫眼电影 top100。具体步骤如下:
1. 打开猫眼电影 top100 页面,获取该页面的 URL。
2. 使用 requests 库发送 GET 请求,获取页面的 HTML 代码。
3. 使用 BeautifulSoup 库解析 HTML 代码,获取电影信息。
4. 通过循环遍历获取所有电影的信息,并将其保存到一个字典或列表中。
5. 可以将结果保存到文件或数据库中。
下面是示例代码,仅供参考:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://maoyan.com/top100'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
movies = []
for item in soup.find_all('div', {'class': 'movie-item-info'}):
movie = {}
movie['rank'] = item.find('i', {'class': 'board-index'}).text
movie['title'] = item.find('a', {'class': 'image-link'}).get('title')
movie['actors'] = item.find('p', {'class': 'star'}).text.strip()[3:]
movie['time'] = item.find('p', {'class': 'releasetime'}).text[5:]
movie['score'] = item.find('p', {'class': 'score'}).text
movies.append(movie)
for movie in movies:
print(movie)
```
这段代码可以获取猫眼电影 top100 的电影名、主演、上映时间、评分等信息,并打印出来。您可以根据需要将其保存到文件中。
阅读全文