首页爬取携程旅游网站的python代码

爬取携程旅游网站的python代码

时间: 2023-12-25 18:30:01 浏览: 135

根据你提供的引用内容，以下是一个爬取携程旅游网站的Python代码示例： ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 设置Edge浏览器驱动路径 driver_path = "C:/path/to/msedgedriver.exe" # 创建Edge浏览器实例 driver = webdriver.Edge(executable_path=driver_path) # 打开携程旅游网站 driver.get("https://www.ctrip.com/") # 等待首页加载完成 wait = WebDriverWait(driver, 10) wait.until(EC.presence_of_element_located((By.CLASS_NAME, "hotel_list"))) # 获取评价数据 comments = driver.find_elements(By.CLASS_NAME, "comment_item") for comment in comments: # 获取评价时间 time = comment.find_element(By.CLASS_NAME, "time").text # 获取评价内容 content = comment.find_element(By.CLASS_NAME, "content").text # 获取评分 score = comment.find_element(By.CLASS_NAME, "score").text # 打印评价数据 print("评价时间:", time) print("评价内容:", content) print("评分:", score) print("--") # 关闭浏览器 driver.quit() ``` 这段代码使用了Selenium库来模拟浏览器操作，通过Edge浏览器驱动打开携程旅游网站，并等待首页加载完成。然后，通过定位元素的方式获取评价数据，包括评价时间、评价内容和评分，并打印出来。最后，关闭浏览器。

阅读全文