使用selenium测试豆瓣电影T0P250数据(电影名称、导演、评论等)
时间: 2024-06-12 18:03:30 浏览: 78
基于Python的豆瓣top250电影爬虫与数据可视化分析设计源码
5星 · 资源好评率100%
以下是使用Python和Selenium测试豆瓣电影TOP250数据的示例代码:
```python
from selenium import webdriver
# 启动浏览器并打开豆瓣电影TOP250页面
driver = webdriver.Chrome()
driver.get('https://movie.douban.com/top250')
# 定位电影列表并获取每个电影的详细信息
movie_list = driver.find_elements_by_xpath('//div[@class="hd"]')
for movie in movie_list:
# 获取电影名称
title = movie.find_element_by_xpath('.//span[@class="title"]')
print('电影名称:', title.text)
# 获取导演和演员信息
info = movie.find_element_by_xpath('.//span[@class="other"]')
print('导演和演员:', info.text)
# 获取电影评分
rating = movie.find_element_by_xpath('../div[@class="bd"]/div[@class="star"]/span[@class="rating_num"]')
print('电影评分:', rating.text)
# 获取电影评论数
comment = movie.find_element_by_xpath('../div[@class="bd"]/div[@class="star"]/span[last()]')
print('评论数:', comment.text)
# 关闭浏览器
driver.quit()
```
上述代码使用了Selenium的`webdriver`模块来启动Chrome浏览器,并打开豆瓣电影TOP250页面。然后,它使用XPath表达式定位电影列表,并从每个电影的元素中提取电影名称、导演和演员信息、电影评分以及评论数。最后,它关闭浏览器。
需要注意的是,这个示例代码只是提供了一个基本的框架,你可能需要根据实际情况进行修改和调整。例如,如果你需要获取更多的电影信息,你可能需要添加更多的XPath表达式来提取它们。另外,你还需要考虑如何处理可能出现的异常情况,例如页面加载失败、元素定位失败等。
阅读全文