BERT模型后门技术研究与攻击方案实现

需积分: 0 59 浏览量更新于2024-11-14 2 收藏 1.85MB ZIP 举报

资源摘要信息:"自然语言处理后门技术研究与实现【毕业设计源码】项目介绍" 自然语言处理（NLP）是人工智能的一个重要分支，它使计算机能够理解、解释和生成人类语言。然而，随着技术的发展，安全问题也日益突出，尤其是在深度学习模型中嵌入后门，可能导致对下游应用的广泛攻击。本毕业设计的核心是研究并实现针对预训练NLP模型，特别是BERT模型的后门攻击技术。后门攻击是一种特殊的攻击方法，攻击者在训练阶段植入后门，使得只有在特定触发条件下，模型才会表现出异常行为。在这个毕业设计中，后门被嵌入到BERT模型中，BERT（Bidirectional Encoder Representations from Transformers）是一种基于Transformer的预训练语言表示方法，广泛应用于各种NLP任务中。在项目实施过程中，研究者选取了WikiText-103数据集进行后门训练，该数据集是一个大规模的维基百科文章语料库，它用来对BERT模型进行掩码语言建模（MLM）任务训练。在训练过程中，通过在数据样本中按比例引入“投毒”样本来植入后门。触发器的设计是关键，它决定了何时以及如何激活后门，从而使得模型对特定输入产生预期之外的行为。项目中详细描述了触发器模式的设计和样本投毒的流程，这些都在项目目录backdoor-bert中有所体现。在微调下游模型并评估攻击效果的环节，研究者对嵌入后门的BERT模型和一个未经修改的干净BERT模型进行比较。两个模型将在相同的下游任务上进行微调，并使用相同的超参数设置，包括随机数种子，以确保实验的一致性。然后，分别使用干净的验证集和含有特定触发器的验证集进行测试，以评估攻击效果。由于不同的NLP任务有不同的评估指标，因此对性能的评估将依据相应任务的标准进行。本项目的标签涉及到自然语言处理、毕业设计、软件/插件以及AI攻击等关键字，指出了该毕业设计的核心内容及技术领域。标签中提到的"AI攻击"，在本项目中特指后门攻击技术，这种技术可能会对使用预训练模型的NLP应用带来潜在的安全威胁。压缩包子文件的文件名称列表中仅提供了"自然语言处理后门技术研究与实现【毕业设计源码】"这一项，表明该项目的源码可能被包含在单一文件中，或者是项目整体打包为一个压缩文件。本毕业设计不仅展示了后门攻击在NLP领域的可行性，也强调了在深度学习模型训练过程中确保安全性的必要性。它为安全研究人员提供了研究后门攻击的新视角，并为预训练模型的用户敲响了警钟，促使他们关注并采取措施，以确保所使用模型的安全性和可靠性。

收起资源包目录

自然语言处理后门技术研究与实现【毕业设计源码】+项目介绍（50个子文件）

README.md 2KB

README.md 118B

0-摘要.md 0B

项目介绍.docx 205KB

lifecycle.png 213KB

使用PyTorch微调BERT-Lightning版本.ipynb 22KB

run_glue.py 9KB

print_result.png 15KB

print_result.py 6KB

run_mlm.py 11KB

README.md 957B

mlm.sh 494B

.gitignore 2KB

backdoor attack.png 385KB

ner.sh 3KB

后门攻击效果展示.ipynb 16KB

qa.sh 3KB

LICENSE 1KB

draw.pptx 181KB

impact_of_epochs.png 100KB

PyTorch-Lightning 实现 ResNet18.ipynb 23KB

对数据集进行统计分析.ipynb 41KB

ResNet和MLP训练速度的对比.ipynb 41KB

GLUE Benchmark 数据集格式.md 4KB

Acc_test.svg 15KB

pipeline.png 118KB

run_qa.py 18KB

2-重要理论与相关工作.md 651B

impact_of_samples.png 82KB

glue.sh 3KB

bert fine-tune example.png 81KB

test2.png 79KB

trainer_qa.py 4KB

draw.ipynb 70KB

使用Trainer微调BERT.ipynb 32KB

通过 SimCSE 相似度搜索过滤触发器.ipynb 573KB

show.png 67KB

README.md 5KB

README.md 33B

requirements.txt 114B

1-绪论.md 3KB

ResNet 分类 CIFAR-10.ipynb 231KB

poison_data_collator.py 4KB

utils_qa.py 21KB

run_ner.py 9KB

练习 TensorBoard.ipynb 13KB

trigger.py 119B

MLP.png 238KB

README.md 2KB

使用PyTorch微调BERT.ipynb 20KB

共 50 条

脑洞笔记

粉丝: 3394
资源: 1252

BERT模型后门技术研究与攻击方案实现

(基于python的毕业设计)漏洞扫描系统(源码+说明+演示视频).zip

基于PHP+python开发的系统快照的入侵检测系统+源码+开发文档（毕业设计&课程设计&项目开发）

网络入侵方案的设计与实现毕业论文.docx

PHP实例开发源码—【微盘】基金宝带余额宝版(已去后门).zip

毕业设计系统代码Flask框架.zip

彩虹易支付全开最新源码 v5.0.zip

PHP实例开发源码—PHPCMS 木马扫描器.zip

追格商城小程序是基于WordPress和uni-app开发的购物商城系统，源代码无加密、无后门！.zip

ASP+ACCESS网上留言板源码与毕业设计参考

百度地图毕业设计源码重构优化体验升级

最新资源