抓取并解析豆瓣读书top250网页 要求一本书籍以一个列表返回
时间: 2024-05-17 08:18:20 浏览: 24
好的,以下是一个示例代码,可以抓取豆瓣读书Top250页面,并将每本书籍以一个列表的形式返回:
```python
import requests
from bs4 import BeautifulSoup
def get_books():
# 请求豆瓣读书Top250页面
url = 'https://book.douban.com/top250?start=0'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 解析页面,获取每本书籍的信息
book_list = []
for book in soup.find_all('tr', class_='item'):
title = book.find('div', class_='pl2').a['title']
link = book.find('div', class_='pl2').a['href']
rating = book.find('span', class_='rating_nums').get_text()
author = book.find('p', class_='pl').get_text().split('/')[0].strip()
press = book.find('p', class_='pl').get_text().split('/')[-3].strip()
year = book.find('p', class_='pl').get_text().split('/')[-2].strip()
price = book.find('p', class_='pl').get_text().split('/')[-1].strip()
book_info = [title, link, rating, author, press, year, price]
book_list.append(book_info)
return book_list
```
您可以调用`get_books()`函数来获取豆瓣读书Top250页面中每本书籍的列表。每本书籍都以一个列表的形式存储在列表中,包含以下信息:书名、链接、评分、作者、出版社、出版年份和价格。