python 爬虫代码 isbn
时间: 2023-07-06 21:41:26 浏览: 74
以下是一个简单的 Python 爬虫代码,用于从豆瓣网站获取图书的 ISBN 号:
```python
import requests
from bs4 import BeautifulSoup
# 请求网页并解析HTML
url = 'https://book.douban.com/subject_search?search_text=Python&cat=1001'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取图书列表并遍历
book_list = soup.find_all('div', class_='info')
for book in book_list:
# 获取图书名称和详情页链接
book_name = book.h2.a.text.strip()
book_link = book.h2.a['href']
# 请求详情页并解析HTML
book_response = requests.get(book_link)
book_soup = BeautifulSoup(book_response.text, 'html.parser')
# 获取ISBN号
isbn = book_soup.find('span', text='ISBN:').next_sibling.strip()
# 输出结果
print(f'{book_name} 的 ISBN 号为 {isbn}')
```
这个代码通过 requests 库发送 HTTP 请求,通过 BeautifulSoup 库解析 HTML,从豆瓣网站获取 Python 类型图书的 ISBN 号并输出。请注意,这个代码仅用于学习和参考,使用时请遵守网站的爬虫规则。
阅读全文