首页用SVM进行情感分析代码

用SVM进行情感分析代码

时间: 2024-05-04 15:22:03 浏览: 116

以下是一个简单的基于SVM的情感分析代码示例，使用sklearn库： ```python from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split from sklearn import svm # 加载数据集 with open("data.txt", "r") as f: data = f.readlines() # 分离文本和标签 text = [] labels = [] for line in data: line = line.strip().split("\t") text.append(line[0]) labels.append(line[1]) # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(text, labels, test_size=0.2, random_state=42) # 特征提取 vectorizer = TfidfVectorizer() X_train = vectorizer.fit_transform(X_train) X_test = vectorizer.transform(X_test) # 训练SVM模型 clf = svm.SVC(kernel='linear') clf.fit(X_train, y_train) # 测试模型准确率 accuracy = clf.score(X_test, y_test) print(f"Accuracy: {accuracy}") # 预测新数据 new_text = ["这是一部非常好的电影！", "这个产品很差，不推荐购买。"] new_text_vec = vectorizer.transform(new_text) predictions = clf.predict(new_text_vec) print(f"Predictions: {predictions}") ``` 其中，数据集文件（data.txt）的格式为每行一个文本和标签（0表示消极，1表示积极），例如： ``` 这部电影很好看。 1 这个产品质量太差了。 0 ``` 在这个例子中，我们使用了tf-idf向量化来提取文本特征，并使用了线性SVM模型进行分类。你可以根据自己的需求选择不同的特征提取方法和模型。

阅读全文