解释以下python代码:def get_movie_list(url): res = requests.get(url, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') movie_list = [] for movie in soup.select('.item'): name = movie.select('.title')[0].text.strip() rating_num = movie.select('.rating_num')[0].text.strip() movie_list.append({'name': name, 'rating_num': rating_num}) return movie_list if __name__ == '__main__': movie_list = get_movie_list(url) for movie in movie_list: print(movie['name'], movie['rating_num'])
时间: 2024-02-07 08:03:34 浏览: 167
这段代码定义了一个函数`get_movie_list`和一个主函数,用于爬取豆瓣电影Top250的电影名称和评分,并输出到控制台。
函数部分的代码如下:
```python
def get_movie_list(url):
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
movie_list = []
for movie in soup.select('.item'):
name = movie.select('.title')[0].text.strip()
rating_num = movie.select('.rating_num')[0].text.strip()
movie_list.append({'name': name, 'rating_num': rating_num})
return movie_list
```
这个函数接收一个参数`url`,表示要爬取的URL,使用requests库发起GET请求,传入请求头,然后使用BeautifulSoup库解析HTML页面。接着,遍历页面中所有电影节点,使用CSS选择器获取电影名称和评分,并存储在字典类型中。最后,将所有电影存储在一个列表中并返回。
主函数的代码如下:
```python
if __name__ == '__main__':
movie_list = get_movie_list(url)
for movie in movie_list:
print(movie['name'], movie['rating_num'])
```
这个主函数首先调用`get_movie_list`函数获取所有电影信息,并将结果存储在`movie_list`变量中。接着,遍历所有电影信息,并输出电影名称和评分到控制台。如果这个脚本被直接运行,`__name__`变量的值为`__main__`,则会执行主函数。
阅读全文