机器学习商品分类实验python
时间: 2023-06-23 11:51:38 浏览: 48
以下是一个简单的机器学习商品分类实验的Python代码示例,使用了朴素贝叶斯分类器:
```python
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split
# 读取商品数据
data = pd.read_csv('products.csv')
# 将商品名称和类别分别存储在X和y中
X = data['name']
y = data['category']
# 将商品名称转换为词向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(X_train, y_train)
# 在测试集上进行预测并评估分类器性能
y_pred = clf.predict(X_test)
accuracy = clf.score(X_test, y_test)
print(f"Accuracy: {accuracy}")
```
上述代码中,首先读取了商品数据文件,然后将商品名称和类别分别存储在X和y中。接着,使用CountVectorizer将商品名称转换为词向量,其中CountVectorizer是一种将文本转换为词频矩阵的工具。然后,通过train_test_split将数据划分为训练集和测试集。接下来,使用MultinomialNB训练朴素贝叶斯分类器,并在测试集上进行预测并评估分类器性能。最后,输出分类器的准确率。
请注意,这只是一个简单的示例,实际应用中还需要对数据进行预处理、特征工程和模型优化等操作。