pycharm爬取百度图片
时间: 2023-08-23 07:11:10 浏览: 108
爬取百度图片
你可以使用PyCharm来编写代码来爬取百度图片。首先,你需要安装所需的库,比如`requests`和`beautifulsoup4`。你可以使用以下命令在PyCharm的终端中安装它们:
```
pip install requests beautifulsoup4
```
接下来,你可以编写Python代码来实现爬取百度图片的功能。以下是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
def download_image(url, file_path):
response = requests.get(url, stream=True)
with open(file_path, 'wb') as file:
for chunk in response.iter_content(1024):
file.write(chunk)
def crawl_baidu_images(keyword, num_images):
url = f'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={keyword}&pn=0&gsm=3c&ct=&ic=0&lm=-1&width=0&height=0'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
image_tags = soup.find_all('img', class_='main_img')
count = 0
for image_tag in image_tags:
image_url = image_tag['src']
download_image(image_url, f'images/{keyword}_{count}.jpg')
count += 1
if count == num_images:
break
crawl_baidu_images('cat', 10)
```
以上代码会根据给定的关键字(这里是'cat')爬取百度图片的前10张图片,并将其保存在一个名为'images'的文件夹中。你可以根据自己的需求修改关键字和图片数量。记得在运行代码前创建一个名为'images'的文件夹。
希望这可以帮助到你!如果你有更多问题,请随时提问。
阅读全文