from selenium import webdriver # 设置Chrome浏览器驱动程序的路径 driver_path = "C:\Program Files\Google\Chrome\Application/chromedriver" # 创建Chrome浏览器对象 driver = webdriver.Chrome(driver_path) # 打开百度网页 driver.get("https://www.baidu.com") # 找到搜索框元素,并输入关键字 search_box = driver.find_element_by_css_selector("#kw") search_box.send_keys("RPA") # 找到搜索按钮元素,并点击 search_button = driver.find_element_by_css_selector("#su") search_button.click() # 等待搜索结果加载完成 driver.implicitly_wait(5) # 获取搜索结果列表 search_results = driver.find_elements_by_css_selector(".result") # 打印搜索结果标题和链接 for result in search_results: title = result.find_element_by_css_selector("h3").text url = result.find_element_by_css_selector("a").get_attribute("href") print(f"Title: {title}") print(f"URL: {url}") print("") # 关闭浏览器 driver.quit() 将读取的数据保存成pdf
时间: 2024-04-20 20:23:17 浏览: 140
要将搜索结果保存为PDF文件,你可以使用第三方库来实现,例如使用`pdfkit`库。
首先,你需要安装`pdfkit`库。在命令行中运行以下命令:
```
pip install pdfkit
```
然后,你需要下载并安装wkhtmltopdf工具,它是将HTML转换为PDF的工具。下载地址:https://wkhtmltopdf.org/downloads.html
安装完成后,你可以按照以下方式修改你的代码来保存搜索结果为PDF文件:
```python
import pdfkit
from selenium import webdriver
# 设置Chrome浏览器驱动程序的路径
driver_path = "C:\Program Files\Google\Chrome\Application/chromedriver"
# 创建Chrome浏览器对象
driver = webdriver.Chrome(driver_path)
# 打开百度网页
driver.get("https://www.baidu.com")
# 找到搜索框元素,并输入关键字
search_box = driver.find_element_by_css_selector("#kw")
search_box.send_keys("RPA")
# 找到搜索按钮元素,并点击
search_button = driver.find_element_by_css_selector("#su")
search_button.click()
# 等待搜索结果加载完成
driver.implicitly_wait(5)
# 获取搜索结果列表的HTML内容
search_results_html = driver.find_element_by_css_selector("body").get_attribute("innerHTML")
# 关闭浏览器
driver.quit()
# 将HTML内容保存为PDF文件
pdfkit.from_string(search_results_html, "search_results.pdf")
```
运行以上代码后,它将会将搜索结果保存为名为`search_results.pdf`的PDF文件。请确保`pdfkit`和`wkhtmltopdf`都已正确安装,并且`wkhtmltopdf`的路径已添加到系统环境变量中。
阅读全文