使用selenium爬取京东Python图书第一本书的信息
时间: 2024-04-28 14:13:38 浏览: 77
用于爬取京东评论的爬虫系统,无需登录,基于Python+selenium+源代码+文档说明
好的,下面是使用Selenium爬取京东Python图书第一本书的信息的步骤:
1. 安装Selenium库和Chrome浏览器驱动。
2. 导入Selenium库和时间库:
```python
from selenium import webdriver
import time
```
3. 创建浏览器对象并访问京东网站:
```python
driver = webdriver.Chrome()
driver.get('https://www.jd.com/')
```
4. 找到搜索框并输入关键词“Python”。
```python
search_box = driver.find_element_by_id('key')
search_box.send_keys('Python')
```
5. 找到搜索按钮并点击。
```python
search_button = driver.find_element_by_class_name('button')
search_button.click()
```
6. 等待页面加载完成。
```python
time.sleep(5)
```
7. 找到图书分类并点击。
```python
book_category = driver.find_element_by_xpath('//*[@id="J_cate"]/ul/li[1]/a')
book_category.click()
```
8. 等待页面加载完成。
```python
time.sleep(5)
```
9. 找到第一本书的标题、价格和链接。
```python
book_title = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[3]/a/em')
book_price = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[2]/strong/i')
book_link = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[1]/a')
```
10. 打印书籍信息。
```python
print('书名:', book_title.text)
print('价格:', book_price.text)
print('链接:', book_link.get_attribute('href'))
```
11. 关闭浏览器。
```python
driver.quit()
```
完整代码如下:
```python
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('https://www.jd.com/')
search_box = driver.find_element_by_id('key')
search_box.send_keys('Python')
search_button = driver.find_element_by_class_name('button')
search_button.click()
time.sleep(5)
book_category = driver.find_element_by_xpath('//*[@id="J_cate"]/ul/li[1]/a')
book_category.click()
time.sleep(5)
book_title = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[3]/a/em')
book_price = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[2]/strong/i')
book_link = driver.find_element_by_xpath('//*[@id="J_goodsList"]/ul/li[1]/div/div[1]/a')
print('书名:', book_title.text)
print('价格:', book_price.text)
print('链接:', book_link.get_attribute('href'))
driver.quit()
```
运行之后就可以爬取京东Python图书第一本书的信息了。
阅读全文