爬取该网址的图书封面信息import requestsfrom bs4 import BeautifulSoupurl = 'https://book.douban.com/subject/36321306/'response = requests.get(url)soup = BeautifulSoup(response.text, 'html.parser')img = soup.select_one('.nbg img')img_url = img['src']with open('book_cover.jpg', 'wb') as f: f.write(requests.get(img_url).content)
时间: 2023-06-15 17:06:33 浏览: 98
这段代码可以爬取该网址的图书封面信息,具体实现过程如下:
1. 引入需要的库requests和BeautifulSoup。
2. 定义需要爬取的网址url。
3. 利用requests库的get()方法获取该网址的响应内容response。
4. 利用BeautifulSoup库的select_one()方法选择该网址中的图书封面图片img。
5. 获取该图书封面图片的url地址img_url。
6. 利用with open()方法以二进制写入模式打开文件book_cover.jpg,将该图书封面图片的二进制内容写入该文件中。
完整代码如下:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://book.douban.com/subject/36321306/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
img = soup.select_one('.nbg img')
img_url = img['src']
with open('book_cover.jpg', 'wb') as f:
f.write(requests.get(img_url).content)
```
需要注意的是,该代码中的`.nbg img`是CSS选择器,用于选择该网址中的图书封面图片。如果你要爬取其他网站的图书封面信息,需要根据该网站的HTML结构来进行相应的修改。
阅读全文