情感分析 pytorch 案例

以下是一个简单的情感分析 PyTorch 案例，以分析电影评论的情感为例： 1. 数据准备首先，我们需要准备数据。我们将使用 IMDb 数据集，该数据集包含 25,000 条电影评论，每条评论都有一个情感标签（正面或负面）。我们将使用 TorchText 库来处理数据和构建词汇表。 ``` import torch import torch.nn as nn import torch.optim as optim import torch.nn.functional as F from torchtext.datasets import IMDB from torchtext.data import Field, LabelField, BucketIterator # 定义字段 TEXT = Field(tokenize='spacy', include_lengths=True) LABEL = LabelField(dtype=torch.float) # 加载数据集 train_data, test_data = IMDB.splits(TEXT, LABEL) # 构建词汇表 TEXT.build_vocab(train_data, max_size=25000, vectors="glove.6B.100d", unk_init=torch.Tensor.normal_) LABEL.build_vocab(train_data) # 定义迭代器 BATCH_SIZE = 64 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') train_iterator, test_iterator = BucketIterator.splits( (train_data, test_data), batch_size=BATCH_SIZE, sort_within_batch=True, device=device) ``` 2. 构建模型接下来，我们将构建一个简单的双向 LSTM 模型。我们将使用预训练的词向量作为输入，并将输出传递到一个全连接层，以便进行分类。 ``` class LSTM(nn.Module): def __init__(self, input_dim, embedding_dim, hidden_dim, output_dim, n_layers, bidirectional, dropout): super().__init__() self.embedding = nn.Embedding(input_dim, embedding_dim) self.lstm = nn.LSTM(embedding_dim, hidden_dim, num_layers=n_layers, bidirectional=bidirectional, dropout=dropout) self.fc = nn.Linear(hidden_dim * 2 if bidirectional else hidden_dim, output_dim) self.dropout = nn.Dropout(dropout) def forward(self, text, text_lengths): embedded = self.dropout(self.embedding(text)) packed_embedded = nn.utils.rnn.pack_padded_sequence(embedded, text_lengths.cpu()) packed_output, (hidden, cell) = self.lstm(packed_embedded) output, output_lengths = nn.utils.rnn.pad_packed_sequence(packed_output) hidden = self.dropout(torch.cat((hidden[-2,:,:], hidden[-1,:,:]), dim=1)) return self.fc(hidden) ``` 3. 训练模型接下来，我们将训练我们的模型。我们将使用二元交叉熵损失和 Adam 优化器。 ``` INPUT_DIM = len(TEXT.vocab) EMBEDDING_DIM = 100 HIDDEN_DIM = 256 OUTPUT_DIM = 1 N_LAYERS = 2 BIDIRECTIONAL = True DROPOUT = 0.5 model = LSTM(INPUT_DIM, EMBEDDING_DIM, HIDDEN_DIM, OUTPUT_DIM, N_LAYERS, BIDIRECTIONAL, DROPOUT) model.embedding.weight.data.copy_(TEXT.vocab.vectors) optimizer = optim.Adam(model.parameters()) criterion = nn.BCEWithLogitsLoss() model = model.to(device) criterion = criterion.to(device) def train(model, iterator, optimizer, criterion): epoch_loss = 0 epoch_acc = 0 model.train() for batch in iterator: text, text_lengths = batch.text optimizer.zero_grad() predictions = model(text, text_lengths).squeeze(1) loss = criterion(predictions, batch.label) acc = binary_accuracy(predictions, batch.label) loss.backward() optimizer.step() epoch_loss += loss.item() epoch_acc += acc.item() return epoch_loss / len(iterator), epoch_acc / len(iterator) def evaluate(model, iterator, criterion): epoch_loss = 0 epoch_acc = 0 model.eval() with torch.no_grad(): for batch in iterator: text, text_lengths = batch.text predictions = model(text, text_lengths).squeeze(1) loss = criterion(predictions, batch.label) acc = binary_accuracy(predictions, batch.label) epoch_loss += loss.item() epoch_acc += acc.item() return epoch_loss / len(iterator), epoch_acc / len(iterator) def binary_accuracy(preds, y): rounded_preds = torch.round(torch.sigmoid(preds)) correct = (rounded_preds == y).float() acc = correct.sum() / len(correct) return acc N_EPOCHS = 5 best_valid_loss = float('inf') for epoch in range(N_EPOCHS): train_loss, train_acc = train(model, train_iterator, optimizer, criterion) valid_loss, valid_acc = evaluate(model, test_iterator, criterion) if valid_loss < best_valid_loss: best_valid_loss = valid_loss torch.save(model.state_dict(), 'tut1-model.pt') print(f'Epoch: {epoch+1:02}, Train Loss: {train_loss:.3f}, Train Acc: {train_acc*100:.2f}%, Val. Loss: {valid_loss:.3f}, Val. Acc: {valid_acc*100:.2f}%') ``` 4. 测试模型最后，我们可以使用训练好的模型对新的评论进行情感分析。我们将使用 `torchtext` 库的 `TabularDataset` 类来加载新的评论数据，并使用 `BucketIterator` 类将它们划分为批次。 ``` from torchtext.data import TabularDataset # 加载新的评论数据 fields = [('text', TEXT)] test_data = TabularDataset( path='new_data.csv', format='csv', skip_header=True, fields=fields) # 构建迭代器 test_iterator = BucketIterator( test_data, batch_size=BATCH_SIZE, sort_within_batch=True, device=device) # 加载模型 model.load_state_dict(torch.load('tut1-model.pt')) # 进行预测 def predict_sentiment(model, sentence): model.eval() tokenized = [tok.text for tok in nlp.tokenizer(sentence)] indexed = [TEXT.vocab.stoi[t] for t in tokenized] length = [len(indexed)] tensor = torch.LongTensor(indexed).to(device) tensor = tensor.unsqueeze(1) length_tensor = torch.LongTensor(length) prediction = torch.sigmoid(model(tensor, length_tensor)) return prediction.item() # 测试模型 positive_review = "This movie is great!" negative_review = "This movie is terrible." print(predict_sentiment(model, positive_review)) # 输出 0.9859121446609497 print(predict_sentiment(model, negative_review)) # 输出 0.03242644390463829 ``` 这个简单的情感分析 PyTorch 案例可以帮助您了解如何使用 PyTorch 和 TorchText 库进行情感分析。

阅读全文

情感分析 pytorch 案例

相关推荐

## 情感分析项目 python

深度学习作业-基于LSTM和TextCNN-pytorch框架python实现情感分析完整源码+代码注释.zip

pyhton情感分析实例

bert情感分析pytorch

学习率优化器的选择与对比：PyTorch案例分析的深度洞见

pytorch nlp 案例

pytorch框架案例

pytorch经典案例

python使用PyTorch和transformers大数据库构建的BERT模型进行情感分析案例代码（5500字附步骤.txt

PyTorch 是一个开源的深度学习框架，它提供了灵活的神经网络构建和训练的功能 几个常见的 PyTorch 项目案例介绍文档

文本情感分析实战：Python PyTorch情感分类数据集介绍

基于PyTorch的情感分析项目：BERT情感分类

使用TextCNN Pytorch进行中文文本情感分析

构建情感分析模型：使用fastnlp和Pytorch技术

PyTorch实现情感分析：百万级评论分类实战

使用PyTorch与transformers的BERT模型进行情感分析实战

多角度分析PyTorch集成模型：探索、优化与实战

【PyTorch循环神经网络】：RNN案例分析与应用

构建高效PyTorch数据增强流水线：实战指南与案例分析

PyTorch数据增强在多任务中的应用：案例研究与差异分析

大家在看

华为CloudIVS 3000技术主打胶片v1.0（C20190226）.pdf

BUPT神经网络与深度学习课程设计

华为光技术笔试-全笔记2023笔试回忆记录

基于neo4j的汽车知识图谱，使用flask构建系统，Echarts可视化.zip

应用基础及基本交易流程共享.pdf

最新推荐

基于OpenCV的人脸识别小程序.zip

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

内网如何运行docker pull mysql:5.7

ImgToString开源工具：图像转字符串轻松实现

Qt框选功能安全性增强指南：防止恶意操作的有效策略

在ros平台中实现人脸识别

PyTorch 是一个开源的深度学习框架，它提供了灵活的神经网络构建和训练的功能几个常见的 PyTorch 项目案例介绍文档