商汤科技:深度学习在遥感解译中的突破与自建平台Parrots

版权申诉
5星 · 超过95%的资源 1 下载量 178 浏览量 更新于2024-06-25 收藏 21.19MB PPTX 举报
本文档深入介绍了商汤科技在人工智能遥感解译领域的应用与技术优势。首先,深度学习在遥感解译中的三大核心要素被强调,包括海量的数据、强大的超级计算能力以及高效的算法。商汤科技拥有一个由8000块GPU组成的硬件超算集群,支持单机多GPU和分布式训练,这使得他们能够处理大规模的遥感数据和复杂的深度学习模型。 伯克利大学提供的单机多GPU支持有限,Facebook虽然支持一定程度的分布式训练,但性能相对较弱。相比之下,Google的产品支持更全面,但存在显存使用过高的问题。商汤科技凭借自家的原创深度学习平台Parrots,不仅解决了这些问题,还能支持超深网络、大数据学习和复杂关联应用,同时强调了自主研发平台的重要性,因为使用开源平台可能会受限于他人技术更新。 然而,直接从VOC、COCO、ImageNet等公开数据集迁移预训练模型(如VGG、GoogLeNet和ResNet)到遥感数据上并不适用,因为遥感数据有其特有的多波段、高光谱和大尺寸的特点,这些标准模型难以满足精度要求,训练耗时且处理速度慢。因此,商汤科技针对性地开发了数据普适模型,包括针对不同数据类型(如8bit、16bit全色、RGB、多光谱和高光谱)和特定场景(如道路、河流、云雪、飞机和舰船检测)的专用模型,以优化处理速度和精度。 此外,文档还提到了模型压缩技术,通过设计更小型的模型,可以在保持基本精度的同时大幅提高效率。模型改进方面,商汤科技结合传统解译方法,引入“面向像素”和“面向对象”的解译策略,利用指数信息和空间相关性进行网络学习,从而提升解译效果。 具体应用实例包括遥感影像的快速处理,如云、雪、水提取(如GF-1卫星MSS分辨率8米的图像在吐鲁番北部和九江等地的处理时间),以及复杂任务如路网提取(1.5米分辨率,12900*8000像素的图像在上海市的处理速度为40秒)、飞机及关键点检测、舰船检测和变化检测等。商汤科技的解决方案不仅考虑了计算效率,也注重技术的自主性和创新性,以推动遥感解译技术的发展。