python实现中文文本情感分析
时间: 2023-11-07 08:03:49 浏览: 150
中文情感分析 Python
5星 · 资源好评率100%
中文文本情感分析可以使用Python中的一些自然语言处理工具来实现,比如jieba分词、情感词典等。
下面是一个简单的例子,使用THULAC进行分词,使用情感词典进行情感分析:
```python
import thulac
import jieba
import jieba.analyse
# 加载情感词典
def load_sentiment_dict(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
lines = f.readlines()
sentiment_dict = {}
for line in lines:
word, score = line.strip().split('\t')
sentiment_dict[word] = float(score)
return sentiment_dict
sentiment_dict = load_sentiment_dict('sentiment_dict.txt')
# 中文分词
def cut_text(text):
thu = thulac.thulac(seg_only=True)
words = thu.cut(text, text=True).split()
return words
# 获取文本情感得分
def get_sentiment_score(text):
words = cut_text(text)
positive_score = 0
negative_score = 0
for word in words:
if word in sentiment_dict:
score = sentiment_dict[word]
if score > 0:
positive_score += score
else:
negative_score += score
return positive_score, negative_score
text = '这个电影真的太好看了!'
positive_score, negative_score = get_sentiment_score(text)
print('正面情感得分:', positive_score)
print('负面情感得分:', negative_score)
```
其中,`sentiment_dict.txt`是一个情感词典文件,每一行表示一个词及其情感得分,例如:
```
好 1.0
不错 0.8
差 -1.0
```
上述例子中使用了THULAC进行分词,也可以使用jieba分词或其他分词工具。另外,还可以使用机器学习算法进行情感分析,例如朴素贝叶斯、支持向量机等。
阅读全文