小米9:NAS驱动的图像超分辨率黑科技突破

需积分: 12 5 下载量 189 浏览量 更新于2024-09-07 收藏 1011KB PDF 举报
小米9的拍照功能中融入了一项黑科技——基于神经架构搜索(Neural Architecture Search, NAS)的图像超分辨率算法。这项技术源自Xiangxiang Chu、Bo Zhang等人发表的研究,他们在《机器之心》上介绍了这一突破性成果。NAS作为一种自动机器学习(AutoML)的方法,通过弹性搜索策略(包括宏观和微观级别的搜索)在图像超分辨率问题上实现了显著的进步。 传统的图像超分辨率(Single Image Super-Resolution, SISR)任务的目标是通过单张低分辨率图像恢复出对应的高分辨率图像,这通常依赖深度学习的非线性拟合能力。然而,现有的SISR模型大多由人工设计,难以进行参数调整和优化。论文中的研究者借鉴了神经架构搜索在分类任务中的成功经验,提出了一种新的搜索策略,能够自动生成在特定计算资源限制(如FLOPs)下表现优异的超分辨率模型,例如超过ECCV 2018年明星模型CARNM。 值得注意的是,这项工作在仅使用一台V100 GPU的短时间内,就实现了高性能的模型设计。这项技术的普适性意味着它不仅限于图像超分辨率,理论上可以应用于其他监督学习任务。作者的贡献主要体现在四个方面: 1. **高效模型设计**:他们发布了一系列快速、准确且轻量级的超分辨率模型,这些模型在性能上接近当前最优解决方案。 2. **搜索策略增强**:在细胞级别结合宏观和微观空间,提升了搜索的灵活性和准确性。 3. **多目标优化**:将超分辨率问题视为一个受限的多目标优化问题,通过混合型控制器实现探索与利用的平衡。 4. **高质量模型生成**:这项工作生成的模型能够在保持高精度的同时,提供优秀的图像超分辨率效果,挑战了当时的SOTA标准。 这项基于NAS的图像超分辨率算法是小米在计算机视觉领域的创新成果,展示了深度学习和自动化设计在提升图像处理性能方面的潜力,对于推动图像重建技术的发展具有重要意义。