运用Selenium库和XPATH、CSS选择数据的方法爬取携程网信息

以下是使用Selenium库和XPATH、CSS选择器爬取携程网信息的示例： ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome() driver.get("https://www.ctrip.com/") # 使用CSS选择器定位输入框并输入关键字 input_box = driver.find_element_by_css_selector("#searchHotelLevelSelect") input_box.send_keys("上海") # 使用CSS选择器定位搜索按钮并点击 search_button = driver.find_element_by_css_selector("#searchHotelLevelSelectBtn") search_button.click() # 等待搜索结果加载完成 wait = WebDriverWait(driver, 10) wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, ".list_mod2"))) # 使用XPATH选择器定位酒店列表并获取信息 hotel_list = driver.find_elements_by_xpath("//ul[@class='hotel_item']/li") for hotel in hotel_list: name = hotel.find_element_by_xpath(".//h2/a").text address = hotel.find_element_by_xpath(".//p[@class='address']/span[1]")text print(name, address) driver.quit() ``` 在上面的示例中，我们使用Selenium库和XPATH、CSS选择器来爬取携程网上的酒店信息。首先，我们使用CSS选择器定位搜索框并输入关键字“上海”，然后使用CSS选择器定位搜索按钮并点击。接下来，我们使用WebDriverWait等待搜索结果加载完成，然后使用XPATH选择器定位酒店列表，并使用find_element_by_xpath方法和相对路径来获取酒店名称和地址信息。最后，我们遍历酒店列表并打印出酒店名称和地址信息。需要注意的是，爬取网站的时候要遵守相关法律法规和网站的爬虫规则，以免引起不必要的法律问题。同时，还需要注意反爬虫机制，如设置User-Agent、使用代理等。

阅读全文

运用Selenium库和XPATH、CSS选择数据的方法爬取携程网信息

相关推荐

基于Python爬取携程网与南京相关的游记数据.zip

基于selenium和Python的东方财富网股票数据分析与爬取设计源码

python数据爬取美食网站xpath解析并将美食数据存入csv文件按照人气数据分析可视化

熟练运用Selenium库，掌握XPATH、CSS选择数据的方法

使用selenium库结合python爬取微博数据的实现过程路线和存在不足

如何使用Python和selenium完成二手车信息网站的数据自动化爬取，并运用pyecharts库来实现数据的可视化展示？

Selenium库爬取今日头条网页数据

如何在Selenium中使用Xpath和CSSselector进行元素定位？请提供实际操作的对比分析。

如何结合使用selenium和pyecharts库在Python环境中自动化爬取二手车信息网站的数据，并实现数据可视化展示？

selenium爬取css框架中的表格数据

Python中selenium爬携程北京景点信息（能爬取多页数据）

使用jupyter notebook Selenium库爬取起点中文网网页数据

使用selenium做翻页处理爬取10页数据信息的代码

使用selenium做翻页处理爬取10页淘宝网的数据信息的代码

selenium库爬取QQ邮箱

selenium爬取数据

xpath定位网页下一页爬取数据但是xpath在改变怎么写

selenium 和xpath

爬虫爬取taobao搜索页商品基本数据（可翻页）+ selenium + Xpath (爬虫具有时效性)

最新推荐

Python selenium爬取微信公众号文章代码详解

python爬取cnvd漏洞库信息的实例

Python Selenium自动化获取页面信息的方法

结合scrapy和selenium爬推特的爬虫总结

Python中Selenium库使用教程详解

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅