python爬虫豆瓣大作业-Python爬虫案例:抓取豆瓣编程类高评分书籍
时间: 2023-06-29 08:19:03 浏览: 159
Python爬虫程序源代码爬取豆瓣TOP250排行榜数据电影名称评分导演演员等信息
好的,以下是抓取豆瓣编程类高评分书籍的Python代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://book.douban.com/tag/%E7%BC%96%E7%A8%8B'
books = []
for i in range(0, 100, 20):
r = requests.get(url + '?start=' + str(i))
soup = BeautifulSoup(r.text, 'html.parser')
items = soup.find_all(class_='subject-item')
for item in items:
title = item.find(class_='info').find('a')['title']
rating = item.find(class_='rating_nums').get_text()
if float(rating) >= 8.0:
books.append(title)
for i, book in enumerate(books):
print(str(i+1) + '. ' + book)
```
这段代码会抓取豆瓣编程类标签下评分高于8.0的书籍名称,并以列表形式输出。请注意,在实际应用中需要注意合适的爬虫策略,以避免对豆瓣网站造成不必要的干扰。
阅读全文