对图片数据清洗的代码
时间: 2023-09-09 18:14:26 浏览: 113
图片数据清洗主要包括以下几个步骤:
1. 去除不需要的图片:比如一些无效的图片、大小不合适的图片、格式不支持的图片等。
2. 压缩图片:对于过大的图片,可以进行压缩来减小图片文件大小,提高处理效率。
3. 调整图片大小:将图片缩小或放大到合适的尺寸,以适应不同的应用场景。
4. 剪裁图片:将图片裁剪成需要的尺寸或比例,以便于后续处理。
下面是一个Python实现的图片数据清洗代码示例,使用了Pillow库来处理图片:
```python
from PIL import Image
import os
# 设置需要清洗的文件夹路径
path = 'path/to/images'
# 设置输出文件夹路径
output_path = 'path/to/output'
# 设置需要清洗的图片格式
extensions = ('.jpg', '.jpeg', '.png')
# 设置需要保留的图片尺寸
min_size = 256
# 遍历文件夹中的图片文件
for filename in os.listdir(path):
if filename.endswith(extensions):
# 打开图片文件
with Image.open(os.path.join(path, filename)) as img:
# 获取图片尺寸
width, height = img.size
# 如果图片尺寸小于设定的最小尺寸,则忽略该图片
if min(width, height) < min_size:
continue
# 压缩图片,使其文件大小不超过1MB
img.save(os.path.join(output_path, filename), optimize=True, quality=85)
```
该代码可以处理指定文件夹中的图片文件,将不符合要求的图片忽略,对符合要求的图片进行压缩和大小调整,并保存到指定的输出文件夹中。可以根据实际需求修改代码中的参数来适应不同的图片数据清洗任务。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)