深度学习驱动的电影评论情感分析:CNN_LSTM 模型的卓越表现

5星 · 超过95%的资源 需积分: 35 10 下载量 48 浏览量 更新于2024-08-09 3 收藏 577KB PDF 举报
"这篇研究论文探讨了如何使用深度学习模型对电影评论数据集进行情感分析。作者们比较了多层感知器(MLP)、长短期记忆(LSTM)循环神经网络、卷积神经网络(CNN)以及它们的混合模型CNN_LSTM在IMDB数据集上的表现。数据集包含50K条电影评论,分为正面和负面两类,经过Word2Vec预处理和词嵌入。结果显示,混合模型CNN_LSTM的准确率最高,达到89.2%,超过了MLP、LSTM和CNN的准确率。此外,这些深度学习模型的表现优于传统的机器学习方法,如SVM、朴素贝叶斯和RNTN。" 文章详细介绍了情感分析在当前大数据环境中的重要性,特别是在互联网和媒体中大量意见的涌现。为了应对这一挑战,研究者采用深度学习技术构建分类情感分析模型。首先,多层感知器被用作其他模型的基础线,接着,LSTM、CNN以及两者的混合模型被开发出来并应用于IMDB电影评论数据集。这个数据集特别之处在于其平衡性,即正负评论各占一半。 在数据预处理阶段,Word2Vec工具被用来创建词嵌入,这是深度学习模型处理文本数据的关键步骤,它将词汇转化为有意义的向量表示。词嵌入能够捕获单词之间的语义关系,这对于理解和分析文本情感至关重要。 实验结果显示,LSTM、CNN和MLP的性能均低于混合的CNN_LSTM模型。这种混合模型结合了LSTM在捕捉长期依赖关系方面的优势和CNN在局部特征检测上的能力,从而提升了情感分析的准确性。具体来说,CNN_LSTM模型的准确率达到了89.2%,而CNN为87.7%,MLP和LSTM则分别是86.74%和86.64%。 此外,论文还指出,这些深度学习模型在英语数据集上的性能优于传统机器学习算法,如支持向量机(SVM)、朴素贝叶斯和递归神经网络时态网络(RNTN)。这表明深度学习在复杂文本分析任务中具有显著优势。 这篇论文揭示了深度学习,特别是LSTM和CNN的组合,在情感分析任务中的强大潜力,尤其在处理大量电影评论等非结构化文本数据时。这一研究不仅有助于改进现有的情感分析系统,也为未来在类似领域中的研究提供了有价值的参考。