dùng python để crawler ảnh
时间: 2024-04-15 16:30:51 浏览: 7
Để sử dụng Python để crawl ảnh, chúng ta có thể sử dụng thư viện requests để tải xuống nội dung của trang web và thư viện BeautifulSoup để phân tích cú pháp HTML và tìm kiếm các thẻ hình ảnh.
Dưới đây là một ví dụ đơn giản về cách crawl ảnh từ một trang web sử dụng Python:
```python
import requests
from bs4 import BeautifulSoup
import os
def download_images(url):
# Gửi yêu cầu GET đến trang web
response = requests.get(url)
# Kiểm tra nếu yêu cầu thành công
if response.status_code == 200:
# Sử dụng BeautifulSoup để phân tích cú pháp HTML
soup = BeautifulSoup(response.content, 'html.parser')
# Tìm tất cả các thẻ hình ảnh trong trang web
img_tags = soup.find_all('img')
# Tạo thư mục để lưu trữ ảnh
os.makedirs('images', exist_ok=True)
# Lặp qua danh sách các thẻ hình ảnh
for img in img_tags:
# Kiểm tra nếu thẻ hình ảnh có thuộc tính 'src'
if 'src' in img.attrs:
# Lấy đường dẫn của hình ảnh
img_url = img.attrs['src']
# Tạo tên file từ đường dẫn hình ảnh
filename = img_url.split('/')[-1]
# Tạo đường dẫn lưu trữ ảnh
filepath = os.path.join('images', filename)
# Tải xuống và lưu trữ ảnh
with open(filepath, 'wb') as file:
# Gửi yêu cầu GET để tải xuống hình ảnh
img_response = requests.get(img_url)
# Ghi dữ liệu vào file
file.write(img_response.content)
print(f"Đã tải