二元生成对抗网络：无监督图像检索的突破

需积分: 10 97 浏览量更新于2024-09-08 收藏 299KB PDF 举报

【标题】"用于图像检索的二元生成对抗网络 (Binary Generative Adversarial Networks for Image Retrieval)" 【描述】该论文深入探讨了在无监督环境下，如何利用二进制生成对抗网络 (BGAN) 进行图像检索，这是深度哈希方法的一个创新应用。传统上，深度哈希的成功往往依赖于有监督的判别模型，而BGAN则引入了生成对抗机制，通过限制生成器的输入噪声为二进制并以图像特征作为条件，使得模型能同时学习图像的二进制表示并生成类似原始图像。核心挑战包括： 1. 如何直接生成高质量的二进制代码，即解决生成过程中的二值化问题，确保生成的二进制编码既能保持信息又能易于存储和处理。 2. 如何在二进制表示下实现高效的图像检索，即设计一种机制，使得尽管使用了二进制编码，但依然能够维持较高的检索精度和性能。论文通过提出新颖的符号激活策略以及结合对抗性、内容和邻域结构的损失函数，解决了这两个问题。实验结果在标准数据集如CIFAR-10、NUSWIDE和Flickr上显示出显著优势，特别是在平均精度(mAP)指标上，相比于现有散列方法，BGAN的性能提升高达107%。这种方法的优势在于其无监督学习的能力，能够在没有标签的情况下对图像进行有效编码，这对于大规模图像数据的检索任务具有重要意义。此外，BGAN生成的二进制代码不仅节省存储空间，还能够通过快速的汉明距离计算进行高效的搜索，这在处理高维图像时尤为关键。综上，本文的研究不仅提升了图像检索的效率，还在无监督学习的背景下，展示了生成对抗网络在图像处理领域的潜在应用价值。通过对比实验验证，BGAN方法对于实际场景中的图像检索任务具有很高的实用性和竞争力。

ShaneHolmes

粉丝: 863
资源: 36

二元生成对抗网络：无监督图像检索的突破

cef_binary_3.2623.1401.gb90a3be_windows32.7z

cef_binary_3.2623.1395.g3034273_macosx64.part1

cef_binary_3.3029.1619.geeeb5d7_windows32.tar.bz2.tar

给出Conditional Generative Adversarial Network 的判别器和生成器训练部分代码

ohos.media.image.Image image = receiver.readNextImage();鸿蒙如何将相机拍进来的img转为二进制且能运行

D_loss_temp = -tf.reduce_mean(M * tf.math.log(D_prob + 1e-8) \ + (1 - M) * tf.math.log(1. - D_prob + 1e-8))

hmin = cv2.getTrackbarPos('hmin', 'h_binary') hmax = cv2.getTrackbarPos('hmax', 'h_binary') smin = cv2.getTrackbarPos('smin', 's_binary') smax = cv2.getTrackbarPos('smax', 's_binary') lmin = cv2.getTrackbarPos('lmin', 'l_binary') lmax = cv2.getTrackbarPos('lmax', 'l_binary')

Uncaught (in promise) Error: Expect options.pdfurl or options.data!

最新资源