BERT中文文本相似度模型源码及项目说明

版权申诉

5星 · 超过95%的资源 97 浏览量更新于2024-10-23 1 收藏 79KB ZIP 举报

资源摘要信息:"本资源是一个关于Python基于BERT模型进行中文文本相似度识别的项目，包含了源代码以及详细的项目说明。该项目主要涉及了两种学习方法：无监督学习和监督学习，具体涵盖了向量白化、对比学习、双塔模型等技术。在无监督学习部分，主要使用了基于BERT模型的几个变种算法，包括bertwhitening、SimCSE_unsupervised、SimCSE_unsupervised_sp、SimCSE_unsupervised_sp_simplified、SimCSE_unsupervised_simplified、ConSERT_unsupervised_shuffle和ESimCSE_unsupervised_endpoints等。这些算法主要通过对比学习的方式，对BERT模型的输出进行白化处理，以提高语义表示的质量和检索速度。在监督学习部分，主要使用了SentenceBERT和SimCSE_supervised两种模型。这些模型采用了与论文相同的损失函数，从transformers加载bert，通过对比学习的方式，对输入的句子进行相似度识别。该资源的适用人群包括计算机相关专业的在校学生、专业老师或企业员工等，可以用于学习借鉴、项目演示、课程设计等多种用途。如果有一定的基础，或者热爱钻研，也可以在此项目代码基础上进行修改添加，实现其他功能。压缩包中的文件名称列表包括：项目说明.md、SimCSE_uns_mlm.py、ESimCSE_unsupervised_endpoints.py、SentenceBERT_endpoints.py、SimCSE_unsupervised_endpoints.py、ConSERT_unsupervised_shuffle.py、SimCSE_ACUM_supervised.py、SentenceBERT.py、SimCSE_supervised.py、SimCSE_unsupervised_endpoint.py等，这些文件包含了项目的具体实现细节和相关的算法实现代码。"

收起资源包目录

Python基于BERT的中文文本相似度识别模型源码+项目说明.zip （35个子文件）

SentenceBERT_endpoint.py 10KB

SimCSE_uns_mlm.py 21KB

misc.xml 297B

SimCSE_supervised.py 15KB

SentenceBERT.py 15KB

TFDataUtils.py 11KB

SimCSE_ACUM_unsupervised_sp_simplified.py 7KB

SimCSE_unsupervised_sp_simplified.py 7KB

SimCSE_ACUM_unsupervised_simplified.py 7KB

SimCSE_unsupervised_simplified.py 6KB

项目说明.md 2KB

SimCSE_ACUM_supervised.py 15KB

SimCSE_unsupervised_endpoint.py 14KB

TFDataUtils.cpython-37.pyc 7KB

FuncUtils.py 899B

SentenceBERT_ACUM_simplified.py 8KB

OptimUtils.cpython-37.pyc 2KB

FuncUtils.cpython-37.pyc 1KB

SimCSE_supervised_simplified.py 7KB

vcs.xml 180B

SimCSE_ACUM_supervised_simplified.py 7KB

ConSERT_unsupervised_shuffle.py 15KB

SimCSE_unsupervised.py 14KB

SimCSE_unsupervised_endpoints.py 17KB

SentenceBERT_simplified.py 8KB

bertwhitening.py 5KB

.gitignore 176B

other.xml 186B

TSBERT.iml 326B

SimCSE_unsupervised_sp.py 14KB

SentenceBERT_endpoints.py 17KB

profiles_settings.xml 174B

modules.xml 264B

OptimUtils.py 2KB

ESimCSE_unsupervised_endpoints.py 18KB

共 35 条

resnetᅟᅠ

粉丝: 3745
资源: 4189

BERT中文文本相似度模型源码及项目说明

分别基于BERT、SentenceBERT、SimCSE算法的文本相似度识别评测python源码+使用说明.zip

毕设项目基于知识图谱和BERT的问答系统python源码+项目说明.zip

基于Bert模型实现用户输入与绿色产业指导目录三级标题匹配任务python源码+项目说明.zip

python的(bert)深度学习文本相似度检测系统设计（完整源码+说明）.zip

基于python+Flask+Paddle-ERNIE实现的的自动派单系统源码+项目说明.zip

基于Bert的系统python源码+项目说明+预训练模型.zip

django项目实战之(bert)深度学习文本相似度检测系统设计(源码+说明+演示视频).zip

基于python(bert)深度学习文本相似度检测系统设计源码.zip

python毕业设计之文本相似度计算系统源码.zip

基于知识图谱和相似度匹配的肝病智能问答系统python源码+说明.zip

最新资源