商汤科技：深度学习在遥感解译中的突破与自建平台Parrots

版权申诉

5星 · 超过95%的资源 178 浏览量更新于2024-06-25 收藏 21.19MB PPTX 举报

本文档深入介绍了商汤科技在人工智能遥感解译领域的应用与技术优势。首先，深度学习在遥感解译中的三大核心要素被强调，包括海量的数据、强大的超级计算能力以及高效的算法。商汤科技拥有一个由8000块GPU组成的硬件超算集群，支持单机多GPU和分布式训练，这使得他们能够处理大规模的遥感数据和复杂的深度学习模型。伯克利大学提供的单机多GPU支持有限，Facebook虽然支持一定程度的分布式训练，但性能相对较弱。相比之下，Google的产品支持更全面，但存在显存使用过高的问题。商汤科技凭借自家的原创深度学习平台Parrots，不仅解决了这些问题，还能支持超深网络、大数据学习和复杂关联应用，同时强调了自主研发平台的重要性，因为使用开源平台可能会受限于他人技术更新。然而，直接从VOC、COCO、ImageNet等公开数据集迁移预训练模型（如VGG、GoogLeNet和ResNet）到遥感数据上并不适用，因为遥感数据有其特有的多波段、高光谱和大尺寸的特点，这些标准模型难以满足精度要求，训练耗时且处理速度慢。因此，商汤科技针对性地开发了数据普适模型，包括针对不同数据类型（如8bit、16bit全色、RGB、多光谱和高光谱）和特定场景（如道路、河流、云雪、飞机和舰船检测）的专用模型，以优化处理速度和精度。此外，文档还提到了模型压缩技术，通过设计更小型的模型，可以在保持基本精度的同时大幅提高效率。模型改进方面，商汤科技结合传统解译方法，引入“面向像素”和“面向对象”的解译策略，利用指数信息和空间相关性进行网络学习，从而提升解译效果。具体应用实例包括遥感影像的快速处理，如云、雪、水提取（如GF-1卫星MSS分辨率8米的图像在吐鲁番北部和九江等地的处理时间），以及复杂任务如路网提取（1.5米分辨率，12900*8000像素的图像在上海市的处理速度为40秒）、飞机及关键点检测、舰船检测和变化检测等。商汤科技的解决方案不仅考虑了计算效率，也注重技术的自主性和创新性，以推动遥感解译技术的发展。

基于VOC、COCO、ImageNet等数据集

上直接finetune的VGG、GoogLeNet、

ResNet等结构网络并不能很好的适用于

遥感数据处理。

不能直接支持遥感多波段、高光谱数据形式；

不能直接支持遥感数据尺寸大的处理特点；

精度差，不能直接满足遥感数据解译特点；

训练耗时长；

处理速度慢；

遥感影像解译的特殊

性

剩余23页未读，继续阅读

小虾仁芜湖

粉丝: 105
资源: 9354

商汤科技：深度学习在遥感解译中的突破与自建平台Parrots

遥感数字图像解译.ppt

遥感解译方法

遥感数字图像计算机解译.pptx

航天宏图--整治“河湖四乱”卫星遥感监管介....pptx

21世纪遥感与gis的发展.pptx

当ArcGIS遇见人工智能.pptx

遥感技术基础07PPT学习教案.pptx

遥感数字影像处理：第1章 绪论.pptx

【精品】陈德清--遥感在支撑水利强监管中的应用.pptx

矿山数据融合与决策优化.pptx

最新资源

遥感数字影像处理：第1章绪论.pptx