爬取携程旅游网站的python代码
时间: 2023-12-25 18:30:01 浏览: 135
根据你提供的引用内容,以下是一个爬取携程旅游网站的Python代码示例:
```python
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 设置Edge浏览器驱动路径
driver_path = "C:/path/to/msedgedriver.exe"
# 创建Edge浏览器实例
driver = webdriver.Edge(executable_path=driver_path)
# 打开携程旅游网站
driver.get("https://www.ctrip.com/")
# 等待首页加载完成
wait = WebDriverWait(driver, 10)
wait.until(EC.presence_of_element_located((By.CLASS_NAME, "hotel_list")))
# 获取评价数据
comments = driver.find_elements(By.CLASS_NAME, "comment_item")
for comment in comments:
# 获取评价时间
time = comment.find_element(By.CLASS_NAME, "time").text
# 获取评价内容
content = comment.find_element(By.CLASS_NAME, "content").text
# 获取评分
score = comment.find_element(By.CLASS_NAME, "score").text
# 打印评价数据
print("评价时间:", time)
print("评价内容:", content)
print("评分:", score)
print("--")
# 关闭浏览器
driver.quit()
```
这段代码使用了Selenium库来模拟浏览器操作,通过Edge浏览器驱动打开携程旅游网站,并等待首页加载完成。然后,通过定位元素的方式获取评价数据,包括评价时间、评价内容和评分,并打印出来。最后,关闭浏览器。
阅读全文