python代码挖掘顾客购物篮数据,找出商品之间的关联性
时间: 2023-05-27 22:07:50 浏览: 100
以下是一个简单的Python代码,用于挖掘顾客购物篮数据,并找出商品之间的关联性:
```python
# 导入需要的库
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
# 读取数据
data = pd.read_csv('shopping_basket.csv', header=None)
# 将数据转换为适合apriori算法的格式
basket = pd.get_dummies(data[0])
basket['Transaction'] = data[1]
# 使用apriori算法查找频繁项集
frequent_itemsets = apriori(basket.drop('Transaction', axis=1), min_support=0.05, use_colnames=True)
# 使用关联规则找到商品之间的关联性
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)
# 输出关联规则
print(rules)
```
在上述代码中,我们使用了`pandas`库来读取购物篮数据,并使用`mlxtend`库中的`apriori`算法查找频繁项集。然后,我们使用`association_rules`函数找到商品之间的关联性,并使用`lift`作为衡量关联性的指标。最后,我们输出了找到的关联规则。
请注意,上述代码仅是一个简单的示例,具体的参数设置需要根据数据的实际情况进行调整。
阅读全文