中文文本情感分类实战：MLP、CNN与RNN模型(Python 3.6, PyTorch 1.1.0)

需积分: 5 31 浏览量更新于2025-01-01 收藏 3.1MB 7Z 举报

资源摘要信息:"简单的中文文本情感分类 (MLP, CNN, RNN in PyTorch) - 2019 THU 人工智能导论作业" 知识点一：中文文本情感分类中文文本情感分类是自然语言处理（NLP）中的一个核心任务，它关注于如何自动识别和分类中文文本所表达的情感倾向。这个任务通常被用于社交媒体监控、品牌声誉管理、市场分析等领域。在情感分类中，文本会被标记为积极、消极或中立等类别。知识点二：MLP、CNN、RNN模型 1. MLP（多层感知器）：一种简单的前馈神经网络，用于进行监督学习，包含至少三层结构：输入层、隐藏层和输出层。MLP在情感分类任务中通过学习文本特征向量的非线性映射来分类文本情感。 2. CNN（卷积神经网络）：最初用于图像处理，通过卷积层自动和有效地提取局部特征。在文本分析中，卷积层能够捕捉到句子中的n-gram特征，从而用于情感分类。 3. RNN（循环神经网络）：适合处理序列数据的神经网络，能够处理任意长度的序列，是处理文本和语音这类时间序列数据的理想选择。RNN通过其隐藏状态捕捉到序列中的上下文信息，从而对情感进行分类。知识点三：PyTorch框架 PyTorch是一个开源机器学习库，它广泛用于计算机视觉和自然语言处理等领域。PyTorch由Facebook的人工智能研究团队开发，使用动态计算图（define-by-run），让网络结构更加灵活，易于调试，特别适合研究和开发。它提供强大的GPU加速、自动微分和丰富的API接口，使得构建和训练深度学习模型更为方便快捷。知识点四：Word2Vec和ELMo预处理技术 Word2Vec是一种将词映射到向量的技术，它包含两种模型：CBOW（连续词袋）和Skip-Gram模型，可以用于构建词嵌入向量。这些向量能够捕捉到词汇之间的语义和句法信息，是文本情感分类任务中重要的预处理步骤。 ELMo是一种基于深度双向语言模型（biLM）的预训练模型，它能够为每个单词生成基于上下文的动态嵌入，相较于静态的词嵌入，ELMo可以更好地捕捉单词的多义性。知识点五：运行环境配置 - Python版本要求：3.6，这是较早的稳定版本，但保证了与许多依赖库的兼容性。 - PyTorch版本要求：1.1.0，这是一个较早的稳定版本，提供了大量的机器学习功能。 - 硬件环境要求：使用的是Intel Xeon CPU E5-2620 v4和NVIDIA TITAN Xp显卡，为深度学习任务提供了强大的计算能力。 - GPU编号：在运行预处理脚本时，需要指定使用的GPU编号为3，确保任务在指定的GPU上执行。知识点六：项目执行流程本项目首先需要运行预处理脚本，支持Word2Vec和ELMo两种预处理技术，脚本名称为`run_preprocess_word2vec.sh`和`run_preprocess_elmo.sh`。之后使用指定的配置文件运行主程序，命令为`python3 main.py --config_path config_cnn.json`，这表明该作业使用的是CNN配置文件。通过这些知识点，可以对整个项目有一个全面的了解，从中文文本情感分类的概念，到机器学习模型的基本知识，再到PyTorch框架的使用，最后是项目的实际执行流程。这对于初学者和专业人士都有极大的参考价值，特别是对于想要在人工智能领域深造的开发者。

资源目录

收起资源包目录

中文文本情感分类实战：MLP、CNN与RNN模型(Python 3.6, PyTorch 1.1.0) （113个子文件）

col_bi-lstm.png 157B

elmo.py 8KB

train_Accuracy.svg 443KB

events.out.tfevents.1559440265.gpu-theta.15460.0 402KB

run_preprocess_word2vec.sh 257B

config.json 493B

embed_dev.svg 57KB

config.json 499B

run_preprocess_elmo.sh 227B

token_embedder.py 4KB

log.txt 455KB

events.out.tfevents.1559437980.gpu-theta.10531.0 402KB

__init__.py 0B

events.out.tfevents.1559409302.gpu-theta.16485.0 402KB

log.txt 311KB

col_mlp.png 134B

lstm_cell_with_projection.py 13KB

encoder_base.py 16KB

col_gru.png 184B

events.out.tfevents.1559406000.gpu-theta.3523.0 402KB

col_cnn.png 191B

config.json 509B

highway.py 3KB

.gitignore 71B

lstm.py 1KB

ssc.iml 398B

events.out.tfevents.1559441032.gpu-theta.21582.0 402KB

classify_layer.py 8KB

events.out.tfevents.1559438048.gpu-theta.14643.0 402KB

self-attention_dev.svg 54KB

embed_train.svg 156KB

config.json 516B

util.py 9KB

dropout_train.svg 157KB

log.txt 309KB

config.json 518B

main.py 16KB

dev_CORR.svg 146KB

log.txt 311KB

embedding_layer.py 2KB

utils.py 408B

events.out.tfevents.1559462040.gpu-theta.19995.0 402KB

config.json 506B

events.out.tfevents.1559402877.gpu-theta.2069.0 402KB

events.out.tfevents.1559405473.gpu-theta.8556.0 402KB

events.out.tfevents.1559399753.gpu-theta.10281.0 402KB

self-attention_train.svg 157KB

config.json 514B

log.txt 311KB

log.txt 310KB

config.json 493B

config.json 514B

config.json 510B

biLM.py 25KB

log.txt 313KB

config.json 395B

run_cnn.sh 103B

col_bi-gru.png 189B

elmo.py 9KB

bn_train.svg 156KB

events.out.tfevents.1559462006.gpu-theta.17687.0 402KB

README.md 13KB

config.json 512B

events.out.tfevents.1559438821.gpu-theta.15937.0 402KB

log.txt 312KB

dev_F1_macro.svg 150KB

dropout_dev.svg 57KB

events.out.tfevents.1559409541.gpu-theta.30631.0 402KB

log.txt 306KB

config.json 519B

dataloader.py 1KB

sinanews.demo 10KB

__main__.py 10KB

log.txt 312KB

events.out.tfevents.1559409399.gpu-theta.22755.0 402KB

frontend.py 7KB

config.json 392B

log.txt 299KB

config.json 395B

log.txt 299KB

events.out.tfevents.1559399750.gpu-theta.9979.0 402KB

events.out.tfevents.1559443831.gpu-theta.16155.0 402KB

config_cnn.json 627B

bn_dev.svg 61KB

run_rnn.sh 103B

config_rnn.json 594B

run_mlp.sh 103B

__init__.py 49B

log.txt 554KB

dev_Accuracy.svg 150KB

preprocess.py 4KB

events.out.tfevents.1559437928.gpu-theta.6850.0 402KB

.gitignore 3KB

.gitignore 60B

events.out.tfevents.1559400227.gpu-theta.32041.0 402KB

col_lstm.png 184B

config.json 519B

config_mlp.json 449B

config.json 511B

config.json 510B

共 113 条

游戏开发小Y

粉丝: 7761
资源: 259

中文文本情感分类实战：MLP、CNN与RNN模型(Python 3.6, PyTorch 1.1.0)

简单的中文文本情感分类 (MLP, CNN, RNN in PyTorch) - 2019 THU 人工智能导论作业.zip

基于python的中文文本情感分类源码 (MLP, CNN, RNN in PyTorch).zip

mlp-mixer-pytorch-main.zip

pytorch-mnist-mlp

mlp-mixer pytorch

MLP-LSTM、CNN-GRU、LSTM-RF用于用电负荷预测的优点

MLP实现多步预测pytorch代码

将attention机制添加到mlp中，使用pytorch

最新资源