请用python代码爬取蔚蓝书店上的数据 ,采集的内容有图书封面、书名、ISBN、作者、价格、出版日期、出版社
时间: 2023-10-30 11:07:48 浏览: 135
好的,我们可以使用Python中的requests和BeautifulSoup库来实现。以下是爬取蔚蓝书店图书信息的代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.bluebook.net.cn/2020/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
book_list = soup.find_all('div', {'class': 'booklist'})
for book in book_list:
# 获取图书封面
cover = book.find('img')['src']
# 获取书名
title = book.find('p', {'class': 'bookname'}).text
# 获取ISBN
isbn = book.find('p', {'class': 'bookisbn'}).text
# 获取作者
author = book.find('p', {'class': 'bookauthor'}).text
# 获取价格
price = book.find('p', {'class': 'bookprice'}).text
# 获取出版日期
pub_date = book.find('p', {'class': 'bookpubdate'}).text
# 获取出版社
publisher = book.find('p', {'class': 'bookpublisher'}).text
print('封面:', cover)
print('书名:', title)
print('ISBN:', isbn)
print('作者:', author)
print('价格:', price)
print('出版日期:', pub_date)
print('出版社:', publisher)
```
这样就可以将蔚蓝书店上的图书信息爬取下来了。需要注意的是,该网站使用了反爬措施,需要加上一些headers信息才能正常爬取。
阅读全文