用SVM进行情感分析代码
时间: 2024-05-04 19:22:03 浏览: 105
以下是一个简单的基于SVM的情感分析代码示例,使用sklearn库:
```python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
from sklearn import svm
# 加载数据集
with open("data.txt", "r") as f:
data = f.readlines()
# 分离文本和标签
text = []
labels = []
for line in data:
line = line.strip().split("\t")
text.append(line[0])
labels.append(line[1])
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(text, labels, test_size=0.2, random_state=42)
# 特征提取
vectorizer = TfidfVectorizer()
X_train = vectorizer.fit_transform(X_train)
X_test = vectorizer.transform(X_test)
# 训练SVM模型
clf = svm.SVC(kernel='linear')
clf.fit(X_train, y_train)
# 测试模型准确率
accuracy = clf.score(X_test, y_test)
print(f"Accuracy: {accuracy}")
# 预测新数据
new_text = ["这是一部非常好的电影!", "这个产品很差,不推荐购买。"]
new_text_vec = vectorizer.transform(new_text)
predictions = clf.predict(new_text_vec)
print(f"Predictions: {predictions}")
```
其中,数据集文件(data.txt)的格式为每行一个文本和标签(0表示消极,1表示积极),例如:
```
这部电影很好看。 1
这个产品质量太差了。 0
```
在这个例子中,我们使用了tf-idf向量化来提取文本特征,并使用了线性SVM模型进行分类。你可以根据自己的需求选择不同的特征提取方法和模型。
阅读全文