Python打开浏览器,打开网页输入内容,抓取到excel
时间: 2023-06-01 18:02:22 浏览: 112
Python实现爬虫抓取与读写、追加到excel文件操作示例
以下是一个Python程序,可以实现打开浏览器,打开指定网页并输入内容,然后抓取到Excel中:
```python
import time
from selenium import webdriver
import pandas as pd
# 打开浏览器
browser = webdriver.Chrome()
# 打开网页
url = 'https://www.baidu.com'
browser.get(url)
# 输入内容
input_box = browser.find_element_by_id('kw')
input_box.send_keys('Python')
# 点击搜索按钮
search_button = browser.find_element_by_id('su')
search_button.click()
# 等待页面加载完成
time.sleep(5)
# 抓取数据
result_list = []
results = browser.find_elements_by_xpath('//div[@class="result c-container "]')
for result in results:
title = result.find_element_by_xpath('.//h3').text
link = result.find_element_by_xpath('.//a').get_attribute('href')
summary = result.find_element_by_xpath('.//div[@class="c-abstract"]').text
result_list.append({'title': title, 'link': link, 'summary': summary})
# 将数据保存到Excel中
df = pd.DataFrame(result_list)
df.to_excel('result.xlsx', index=False)
# 关闭浏览器
browser.quit()
```
需要注意的是,此程序依赖于Selenium和Pandas两个库,需要先安装这两个库。可以使用以下命令安装:
```
pip install selenium pandas
```
另外,程序中使用了Chrome浏览器,需要先下载Chrome浏览器并安装ChromeDriver。ChromeDriver下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads。下载完成后,需要将ChromeDriver的路径添加到系统的环境变量中。
阅读全文