基于svm的文本情感分析代码实现
时间: 2023-07-26 19:29:17 浏览: 119
基于svm的文本情感分析
5星 · 资源好评率100%
以下是一个基于SVM的文本情感分析的Python代码实现,其中使用了scikit-learn库中的SVM算法和情感分析数据集:
```python
from sklearn import svm
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
# 导入情感分析数据集
with open('sentiment_analysis_dataset.txt', 'r', encoding='utf-8') as file:
data = file.readlines()
# 数据预处理,将文本和标签分别存储
texts = []
labels = []
for line in data:
label, text = line.strip().split('\t')
texts.append(text)
labels.append(int(label))
# 将文本数据转换成特征向量,采用词袋模型
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(texts)
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.2, random_state=42)
# 训练SVM模型
clf = svm.SVC(kernel='linear')
clf.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = clf.predict(X_test)
# 计算模型的准确率
accuracy = sum(y_pred == y_test) / len(y_test)
print('Accuracy:', accuracy)
```
注意:这只是一个简单的示例代码,实际应用中需要进行更加严谨的数据预处理、特征工程和模型调优。
阅读全文