用python写一个智能问答系统
时间: 2023-08-04 17:32:59 浏览: 104
好的,下面是一个简单的示例:
首先,需要导入必要的库:
```python
import json
import nltk
import numpy as np
import pandas as pd
from nltk.corpus import stopwords
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
```
然后,需要加载数据集。可以使用一个包含问题和答案的JSON文件:
```python
with open('qa_data.json', 'r') as f:
qa_data = json.load(f)
```
接下来,需要进行文本预处理。这里使用NLTK库来进行分词和去除停用词:
```python
nltk.download('stopwords')
stop_words = stopwords.words('english')
def preprocess(text):
words = nltk.word_tokenize(text.lower())
words = [word for word in words if word.isalnum() and word not in stop_words]
return ' '.join(words)
```
然后,可以使用TF-IDF算法来计算每个问题的向量表示:
```python
corpus = [preprocess(qa['question']) for qa in qa_data]
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(corpus)
```
接下来,可以使用余弦相似度来计算问题之间的相似度:
```python
def get_best_answer(question):
question_vec = vectorizer.transform([preprocess(question)])
similarities = cosine_similarity(X, question_vec)
best_match_index = np.argmax(similarities)
return qa_data[best_match_index]['answer']
```
最后,可以使用上面的函数来回答用户的问题:
```python
while True:
question = input('Please enter your question: ')
answer = get_best_answer(question)
print(answer)
```
以上就是一个简单的智能问答系统的实现。当然,这只是一个示例,实际应用中可能需要更复杂的算法和处理步骤。
阅读全文