基于随机梯度下降的矩阵分解推荐算法（python）_随机梯度下降矩阵分解

158 浏览量更新于2023-05-11 评论 1 收藏 109KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

基于随机梯度下降的矩阵分解推荐算法（基于随机梯度下降的矩阵分解推荐算法（python））

主要为大家详细介绍了基于随机梯度下降的矩阵分解推荐算法，具有一定的参考价值，感兴趣的小伙伴们可以参

考一下

SVD是矩阵分解常用的方法，其原理为：矩阵M可以写成矩阵A、B与C相乘得到，而B可以与A或者C合并，就变成了两个元素

M1与M2的矩阵相乘可以得到M。

矩阵分解推荐的思想就是基于此，将每个user和item的内在feature构成的矩阵分别表示为M1与M2，则内在feature的乘积得到

M；因此我们可以利用已有数据（user对item的打分）通过随机梯度下降的方法计算出现有user和item最可能的feature对应到的

M1与M2（相当于得到每个user和每个item的内在属性），这样就可以得到通过feature之间的内积得到user没有打过分的item的

分数。

本文所采用的数据是movielens中的数据，且自行切割成了train和test，但是由于数据量较大，没有用到全部数据。

代码如下：

# -*- coding: utf-8 -*-

"""

Created on Mon Oct 9 19:33:00 2017

@author: wjw

"""

import pandas as pd

import numpy as np

import os

def difference(left,right,on): #求两个dataframe的差集

df = pd.merge(left,right,how='left',on=on) #参数on指的是用于连接的列索引名称

left_columns = left.columns

col_y = df.columns[-1] # 得到最后一列

df = df[df[col_y].isnull()]#得到boolean的list

df = df.iloc[:,0:left_columns.size]#得到的数据里面还有其他同列名的column

df.columns = left_columns # 重新定义columns

return df

def readfile(filepath): #读取文件，同时得到训练集和测试集

pwd = os.getcwd()#返回当前工程的工作目录

os.chdir(os.path.dirname(filepath))

#os.path.dirname()获得filepath文件的目录；chdir()切换到filepath目录下

initialData = pd.read_csv(os.path.basename(filepath))

#basename()获取指定目录的相对路径

os.chdir(pwd)#回到先前工作目录下

predData = initialData.iloc[:,0:3] #将最后一列数据去掉

newIndexData = predData.drop_duplicates()

trainData = newIndexData.sample(axis=0,frac = 0.1) #90%的数据作为训练集

testData = difference(newIndexData,trainData,['userId','movieId']).sample(axis=0,frac=0.1)

return trainData,testData

def getmodel(train):

slowRate = 0.99

preRmse = 10000000.0

max_iter = 100

features = 3

lamda = 0.2

gama = 0.01 #随机梯度下降中加入，防止更新过度

user = pd.DataFrame(train.userId.drop_duplicates(),columns=['userId']).reset_index(drop=True) #把在原来dataFrame中的索引重新设置，drop=True并抛弃

movie = pd.DataFrame(train.movieId.drop_duplicates(),columns=['movieId']).reset_index(drop=True)

userNum = user.count().loc['userId'] #671

movieNum = movie.count().loc['movieId']

userFeatures = np.random.rand(userNum,features) #构造user和movie的特征向量集合

movieFeatures = np.random.rand(movieNum,features)

#假设每个user和每个movie有3个feature

userFeaturesFrame =user.join(pd.DataFrame(userFeatures,columns = ['f1','f2','f3']))

movieFeaturesFrame =movie.join(pd.DataFrame(movieFeatures,columns= ['f1','f2','f3']))

userFeaturesFrame = userFeaturesFrame.set_index('userId')

movieFeaturesFrame = movieFeaturesFrame.set_index('movieId') #重新设置index

for i in range(max_iter):

rmse = 0

n = 0

for index,row in user.iterrows():

uId = row.userId

userFeature = userFeaturesFrame.loc[uId] #得到userFeatureFrame中对应uId的feature

u_m = train[train['userId'] == uId] #找到在train中userId点评过的movieId的data

for index,row in u_m.iterrows():

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

weixin_38645865

粉丝: 10
资源: 924

会员权益专享

基于随机梯度下降的矩阵分解推荐算法（python）

评论0

会员权益专享

最新资源

基于随机梯度下降的矩阵分解推荐算法（python）

评论0

矩阵分解的推荐算法 matlab实现

几种矩阵分解算法的matlab实现

Python 计算混淆矩阵

矩阵分解推荐算法python

随机梯度下降算法和正规方程python机器学习

基于随机梯度下降的PCA代码

概率矩阵分解python

梯度下降算法python 完整代码

随机梯度下降最优化 python

基于python的推荐系统

梯度下降算法代码python

python实现梯度下降算法

python梯度下降算法

python实现梯度下降算法函数

由随机梯度上升算法，改进成小批量梯度上升算法，python

python实现小批量梯度下降算法

由随机梯度上升算法，实现小批量梯度上升算法，python

基于Python共轭梯度算法

人工智能梯度下降算法

会员权益专享

最新资源