CVM-Net: 一种基于深度学习的地对空图像地理定位方法

需积分: 7 41 浏览量更新于2024-11-19 收藏 5.21MB ZIP 举报

资源摘要信息:"crossview_localisation" 该项目名为"crossview_localisation"，主要研究基于图像的地对空地理定位问题，并提出了一种名为CVM-Net（Cross View Matching Network）的跨视图匹配网络。该网络利用深度学习技术，以卫星图像作为参考图进行地面图像的地理位置查询。地理定位技术是计算机视觉领域的重要研究方向之一，其目的是通过分析图像信息来确定观测对象的地理位置。在地对空地理定位的场景中，需要从卫星图像数据库中查询匹配的地面图像，并确定地面图像拍摄地点的地理位置，通常以纬度和经度表示。为了解决这一问题，CVM-Net网络采用了一种深度学习框架，用于提取地面图像和卫星图像的全局描述符。具体而言，CVM-Net使用了VGG16网络来提取图像的局部特征，局部特征经过NetVLAD（Neural Network architecture for Vector of Locally Aggregated Descriptors）层处理，聚合为全局描述符。这种描述符能够表达图像的整体内容，从而更好地用于图像间的匹配。 CVM-Net采用的Siamese架构是一种深度神经网络，它包含两个或多个相同的子网络，这些子网络共享相同的参数和权重，并行工作以处理不同的输入数据。在训练阶段，Siamese网络通过比较不同视图下的图像特征，学习到如何区分相似与不同的图像对，从而提高图像匹配的准确性。该项目的研究内容涉及以下几个重要的知识点： 1. 图像检索问题：在给定大量带有地理标签的卫星图像数据库中，根据地面图像找到对应的卫星图像，并获取其地理位置信息。 2. 深度学习框架：使用深度学习网络提取图像特征，该框架结合了VGG16网络的局部特征提取能力和NetVLAD的全局描述符聚合能力。 ***VLAD层：一种用于聚合局部特征向量成为全局描述符的技术，能够使得图像的特征描述符具有更好的区分度和鲁棒性。 4. Siamese架构：一种特殊的深度学习网络结构，包含两个或多个相同的子网络分支，用于学习输入对之间的相似性或差异性。 5. 地理定位技术：通过分析地面图像和卫星图像的匹配，确定地面图像拍摄地点的具体地理位置。 6. Python编程：在该项目中，Python语言被用于编写网络训练和测试脚本，以及实现各种数据处理和分析任务。通过本项目的研究，可以推动图像地理定位技术的发展，尤其是解决因视点变化而导致的匹配困难问题。这在无人机导航、遥感数据处理和智能地图服务等领域具有潜在的应用价值。

资源目录

收起资源包目录

CVM-Net: 一种基于深度学习的地对空图像地理定位方法（15个子文件）

cvm_net.PNG 239KB

input_data.py 5KB

train.py 7KB

siamese_fc.py 1KB

loupe.py 16KB

readme_model_1.txt 123B

_config.yml 27B

README.md 5KB

transnet_v2.py 3KB

VGG.py 4KB

readme_model_2.txt 124B

readme_result.txt 38B

cvm_net.py 3KB

readme_model_2.txt 56B

2018_CVM-Net_CVPR.pdf 5.5MB

共 15 条

莊謙

粉丝: 26
资源: 4629

CVM-Net: 一种基于深度学习的地对空图像地理定位方法

nodelocalisation.zip_localisation_node_wsns

Projet_S2_BatKorys_Localisation

matlab运行代码暂停-3dof_vehicle_localisation:3dof_vehicle_localisation

wifi_localisation

TDOA_Localisation

object_localisation_d435

object_localisation:一个Computer Vision项目（LOK_1），用于使用边界框标记对象，使其尽可能接近拟合

Localisation indoor

matlab飞行轨迹代码-Localisation_Mapping:使用LIDAR可视化探索建筑物的2D机器人-CourseraUPennRo

Linux Localisation Initiative-开源

最新资源