python文本情感分析项目代码
时间: 2024-11-06 08:11:18 浏览: 48
Python 文本情感分析项目通常会结合自然语言处理 (NLP) 和机器学习技术来识别和评估文本的情感倾向。以下是一个简单的例子,展示如何使用NLTK库和scikit-learn进行情感分类:
```python
# 导入必要的库
import nltk
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import classification_report
# 下载NLTK数据集
nltk.download('vader_lexicon')
# 定义情感极性字典
def get_sentiment(text):
analyzer = SentimentIntensityAnalyzer()
sentiment = analyzer.polarity_scores(text)
return sentiment['compound']
# 示例文本数据
texts = ['这个电影太棒了!', '我很失望这次的服务', '我喜欢这本书']
labels = [1 if sentiment > 0 else -1 for sentiment in map(get_sentiment, texts)] # +1代表正面,-1代表负面
# 将文本转换为特征向量
vectorizer = CountVectorizer()
features = vectorizer.fit_transform(texts)
# 使用朴素贝叶斯模型进行训练
model = MultinomialNB()
model.fit(features, labels)
# 测试并预测新数据
test_text = "今天的天气真好"
test_features = vectorizer.transform([test_text])
predicted_label = model.predict(test_features)[0]
print(f"测试文本:{test_text}, 预测情感:{predicted_label}")
阅读全文