深度学习模型在文本分类数据集上的性能评估

需积分: 13 111 浏览量更新于2024-11-27 收藏 20.23MB ZIP 举报

资源摘要信息: "Text_Classification_Capstone" 是一个学术性质的研究项目，旨在评估几种最新深度学习模型在不同文本分类数据集上的性能。该项目由南洋理工大学的硕士研究生Diardano Raihan主导，并采用多种深度学习技术进行文本数据的分类。研究中涉及的深度学习模型包括前馈神经网络、递归神经网络（如循环神经网络RNN和长短期记忆网络LSTM）、卷积神经网络（CNN）以及基于集合的神经网络。此外，实验使用了词嵌入（Word Embeddings）技术来作为特征提取器，以提高模型的预测性能。实验的数据集包括五个不同的文本数据集，它们分别是：MR、SUBJ、TREC、CR和MPQA。这些数据集具有不同的特征，如类别数、平均句子长度、数据集大小、口音大小和测试集大小。例如，MR数据集包含2个类别，平均句子长度为20，总共有10662个样本，口音大小为18758，测试集大小未明确给出，但在列表中留有空白以待填充。其他数据集的特性也类似地被列出。研究结果指出，词嵌入技术为各个模型提供了高质量的特征提取能力，这对于改进模型的最终预测性能非常重要。此外，基于集合的时空卷积神经网络（CNN）在实验中展现了优异的性能，甚至能够与当前最先进的基准模型相竞争。这一发现对学术界和工业界都有着重要的参考价值。项目的文档和代码文件被命名为 "Text_Classification_Capstone-main"，这暗示了这是一个主要的工作版本，可能包含了Jupyter Notebook文件。Jupyter Notebook是一种开源的Web应用程序，允许用户创建和共享包含实时代码、方程、可视化和文本的文档。它广泛用于数据清理和转换、数值模拟、统计建模、机器学习等众多领域。在这个项目中，Jupyter Notebook很可能被用作实现模型训练、评估和结果可视化的主要工具。从标签 "JupyterNotebook" 可以推测，项目文件是以一种可交互的方式组织的，这有助于研究者和同行评审者追踪实验的每个步骤，理解模型的架构设计和训练过程，以及方便地展示实验结果。实验的Jupyter Notebook可能包括了对不同模型的比较分析，对数据集的探索性数据分析，模型参数的调优过程，以及性能评估指标的计算等。总的来说，"Text_Classification_Capstone" 项目不仅对文本分类的深度学习模型进行了深入的评估，也为该领域的研究提供了宝贵的实验数据和实践经验。通过此项目，研究人员可以进一步了解不同深度学习架构在处理自然语言时的优缺点，为未来的算法设计和实际应用奠定基础。

资源目录

收起资源包目录

深度学习模型在文本分类数据集上的性能评估（345个子文件）

CNN_CR-checkpoint.ipynb 239KB

CNN_MPQA-checkpoint.ipynb 268KB

CNN_TREC-checkpoint.ipynb 320KB

CNN_MPQA.ipynb 268KB

TCN_SUBJ-checkpoint.ipynb 583KB

rt-polarity.all 1.2MB

CNN_MPQA-checkpoint.ipynb 268KB

TCN_CR.ipynb 1019KB

CNN_TREC.ipynb 320KB

Visualization-checkpoint.ipynb 1.1MB

CNN_TREC-checkpoint.ipynb 320KB

HYBRID_SUBJ.ipynb 650KB

CNN_MR.ipynb 729KB

CNN_SUBJ-checkpoint.ipynb 701KB

CNN_TREC-checkpoint.ipynb 320KB

CNN_TREC.ipynb 320KB

CNN_CR-checkpoint.ipynb 301KB

CNN_CR-checkpoint.ipynb 239KB

edRVFL_CR-checkpoint.ipynb 300KB

CNN_MPQA.ipynb 268KB

TCN_CR-checkpoint.ipynb 1019KB

CNN_TREC.ipynb 320KB

CNN_MPQA.ipynb 776KB

HYBRID_MR.ipynb 572KB

CNN_SUBJ.ipynb 701KB

CNN_MR-checkpoint.ipynb 628KB

CNN_MR.ipynb 628KB

CNN_MPQA-checkpoint.ipynb 268KB

CNN_MR-checkpoint.ipynb 628KB

MLP_MPQA.ipynb 375KB

HYBRID_MPQA-checkpoint.ipynb 634KB

TCN_TREC-checkpoint.ipynb 244KB

TCN_MR-checkpoint.ipynb 767KB

CNN_MPQA.ipynb 268KB

HYBRID_CR.ipynb 846KB

edRVFL_SUBJ-checkpoint.ipynb 715KB

Naive_Bayes_MR.ipynb 402KB

CNN_MR-checkpoint.ipynb 628KB

CNN_SUBJ-checkpoint.ipynb 701KB

MLP_TREC-checkpoint.ipynb 359KB

TCN_MPQA-checkpoint.ipynb 742KB

HYBRID_TREC.ipynb 272KB

Naive_Bayes_TREC.ipynb 254KB

CNN_CR.ipynb 826KB

MLP_MPQA-checkpoint.ipynb 375KB

TCN_MR.ipynb 767KB

MLP_CR-checkpoint.ipynb 355KB

TCN_SUBJ.ipynb 583KB

HYBRID_MPQA.ipynb 634KB

CNN_SUBJ.ipynb 741KB

CNN_MR.ipynb 628KB

CNN_CR-checkpoint.ipynb 239KB

edRVFL_TREC-checkpoint.ipynb 339KB

CNN_CR.ipynb 239KB

TREC.train.all 286KB

CNN_MPQA-checkpoint.ipynb 268KB

CNN_SUBJ.ipynb 701KB

CNN_MR.ipynb 628KB

Naive_Bayes_SUBJ-checkpoint.ipynb 445KB

edRVFL_SUBJ.ipynb 715KB

CNN_MR.ipynb 628KB

HYBRID_MR-checkpoint.ipynb 572KB

CNN_TREC.ipynb 320KB

CNN_CR-checkpoint.ipynb 239KB

TREC.test.all 19KB

HYBRID_SUBJ-checkpoint.ipynb 650KB

HYBRID_TREC-checkpoint.ipynb 272KB

edRVFL_MPQA.ipynb 292KB

CNN_CR.ipynb 239KB

MLP_TREC.ipynb 359KB

MLP_MR.ipynb 723KB

Naive_Bayes_MR-checkpoint.ipynb 402KB

Naive_Bayes_TREC-checkpoint.ipynb 254KB

edRVFL_MPQA-checkpoint.ipynb 292KB

edRVFL_MR-checkpoint.ipynb 648KB

MLP_SUBJ.ipynb 802KB

CNN_SUBJ-checkpoint.ipynb 701KB

MLP_CR.ipynb 355KB

edRVFL_CR.ipynb 300KB

CNN_MR-checkpoint.ipynb 442KB

CNN_CR.ipynb 239KB

edRVFL_MR.ipynb 648KB

TCN_TREC.ipynb 244KB

Visualization.ipynb 1.1MB

Naive_Bayes_SUBJ.ipynb 445KB

CNN_SUBJ.ipynb 701KB

CNN_MPQA-checkpoint.ipynb 268KB

MLP_MR-checkpoint.ipynb 723KB

CNN_MR-checkpoint.ipynb 628KB

edRVFL_TREC.ipynb 339KB

TCN_MPQA.ipynb 742KB

MLP_SUBJ-checkpoint.ipynb 802KB

CNN_MPQA.ipynb 268KB

DEEP LEARNING TECHNIQUES FOR TEXT CLASSIFICATION.docx 82KB

CNN_CR.ipynb 239KB

CNN_SUBJ.ipynb 701KB

CNN_TREC-checkpoint.ipynb 320KB

subj.all 1.26MB

HYBRID_CR-checkpoint.ipynb 846KB

共 345 条

weixin_42156940

粉丝: 25
资源: 4629

深度学习模型在文本分类数据集上的性能评估

Bert-Chinese-Text-Classification-Pytorch:使用Bert，ERNIE，进行中文文本分类

Fudanchinese_text_classification.rar

text_classification：具有深度学习功能的各种文本分类模型等

text_classification_by_transformer:使用Transformer模型进行文本的分类，基于Tensorflow2.3开发

tensorflow_text_classification:在TensorFlow中实现文本分类的多种模型

Transformers_for_Text_Classification：基于Transformers的文本分类

Text_Classification：文本分类算法：调查

chinese_text_classification:通过一个中文文本分类问题系统实现了各种分类方法

svm_chinese_textclassification:SVM中文文本分类

cnn_text_classification:Tensorflow CNN文本分类的实现

最新资源