AIGC技术探索：训练数据溯源与研究进展

50 浏览量更新于2024-06-14 收藏 30.16MB PPTX 举报

"AIGC溯源场景及研究进展主要关注了人工智能生成内容（AIGC）在版权保护和水印技术中的应用。近年来，随着AIGC技术的发展，如何追踪和验证由这些模型生成内容的来源成为了重要的研究课题。本文提到了几个关键的研究方向和成果，包括训练数据的检测与归属、微调模型的预训练模型溯源、文本到图像模型的数据归属评估以及主动扩散水印技术用于因果归属。以下是对这些研究的详细说明： 1️⃣ Detection and Attribution of Models Trained on Generated Data (ICASSP, 2024)：该研究探讨了如何检测和归属那些基于生成数据训练的模型。研究人员提出了RQ1和RQ2两个核心问题：模型的训练数据是真实数据还是伪造数据？如果使用了伪造数据，是由哪个生成对抗网络（GAN）产生的？实验设计中，真实数据被分为训练数据、探测数据集和测试数据集，以便训练GAN并分析其生成的数据对模型的影响。 2️⃣ Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large Language Models (ACL, 2023)：这项工作集中在关联微调后的模型与其原始的大型语言模型。它旨在确定经过微调的模型与哪个预训练模型有最紧密的关系，这有助于理解模型的知识转移和学习过程。 3️⃣ Evaluating Data Attribution for Text-to-Image Models (ICCV, 2023)：此研究关注的是评估文本到图像模型的数据归属，即确定生成的图像数据与特定训练数据集之间的联系。这对于理解和验证AIGC模型的训练过程至关重要。 4️⃣ ProMark: Proactive Diffusion Watermarking for Causal Attribution (CVPR, 2024)：ProMark是一种主动扩散水印技术，旨在为AIGC生成的图像添加隐藏的标记，以进行因果归属。这种水印方法可以防止内容被盗用，并提供一种方法来追踪生成模型的源头。 5️⃣ DE-FAKE: Detection and Attribution of Fake Images Generated by Text-to-Image Generation Models (CCS, 2023)：DE-FAKE专注于识别和归属由文本到图像生成模型创造的假图像。这种方法对于检测网络上的虚假信息和保护知识产权具有重要意义。这些研究共同推动了AIGC领域的前进，特别是在版权保护和数据源追踪方面。随着技术的不断进步，未来的研究可能会探索更高级的验证方法，以确保AIGC的透明度和可信度。"

4/18

论

文

信

息

HanG,SalemA,LiZ,etal.DetectionandAttributionofModelsTrainedonGeneratedData.ICASSP,2024.

Scenario: 生成模型溯源训练数据

剩余19页未读，继续阅读

_Meilinger_

粉丝: 1255

AIGC技术探索：训练数据溯源与研究进展

博士论文写作攻略：从文献研读到创新探索

研究生文献阅读与笔记策略

微粒群优化算法经典文献回顾与研究进展

体育科学文献研读及处理.ppt

文献研读（每次课研读3篇）.zip

文献研读：Stable Cooperation in Dynamic Vehicle Routing Problems

文献研读：在集装箱班轮航运网络中逆转港口循环方向

视频分析与目标检测和跟踪研究重点研读文献.rar

1410658_研读文献报告1

小学语文集体备课专题式教材研读有效策略研究报告琰研究报告.doc

最新资源