import pandas as pd import numpy as np # 计算用户对歌曲的播放比例 triplet_dataset_sub_song_merged_sum_df = triplet_dataset_sub_song_mergedpd[['user', 'listen_count']].groupby('user').sum().reset_index() triplet_dataset_sub_song_merged_sum_df.rename(columns={'listen_count': 'total_listen_count'}, inplace=True) triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_mergedpd, triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_mergedpd['fractional_play_count'] = triplet_dataset_sub_song_mergedpd['listen_count'] / triplet_dataset_sub_song_merged['total_listen_count'] # 将用户和歌曲编码为数字 small_set = triplet_dataset_sub_song_mergedpd user_codes = small_set.user.drop_duplicates().reset_index() song_codes = small_set.song.drop_duplicates().reset_index() user_codes.rename(columns={'index': 'user_index'}, inplace=True) song_codes.rename(columns={'index': 'song_index'}, inplace=True) song_codes['so_index_value'] = list(song_codes.index) user_codes['us_index_value'] = list(user_codes.index) small_set = pd.merge(small_set, song_codes, how='left') small_set = pd.merge(small_set, user_codes, how='left') # 将数据转换为稀疏矩阵形式 from scipy.sparse import coo_matrix mat_candidate = small_set[['us_index_value', 'so_index_value', 'fractional_play_count']] data_array = mat_candidate.fractional_play_count.values row_array = mat_candidate.us_index_value.values col_array = mat_candidate.so_index_value.values data_sparse = coo_matrix((data_array, (row_array, col_array)), dtype=float) # 使用SVD方法进行矩阵分解并进行推荐 from scipy.sparse import csc_matrix from scipy.sparse.linalg import svds import math as mt def compute_svd(urm, K): U, s, Vt = svds(urm, K) dim = (len(s), len(s)) S = np.zeros(dim, dtype=np.float32) for i in range(0, len(s)): S[i, i] = mt.sqrt(s[i]) U = csc_matrix(U, dtype=np.float32) S = csc_matrix(S, dtype=np.float32) Vt = csc_matrix(Vt, dtype=np.float32) return U, S, Vt def compute_estimated_matrix(urm, U, S, Vt, uTest, K, test): rightTerm = S * Vt max_recommendation = 250 estimatedRatings = np.zeros(shape=(MAX_UID, MAX_PID), dtype=np.float16) recomendRatings = np.zeros(shape=(MAX_UID, max_recommendation), dtype=np.float16) for userTest in uTest: prod = U[userTest, :] * rightTerm estimatedRatings[userTest, :] = prod.todense() recomendRatings[userTest, :] = (-estimatedRatings[userTest, :]).argsort()[:max_recommendation] return recomendRatings K = 50 urm = data_sparse MAX_PID = urm.shape[1] MAX_UID = urm.shape[0] U, S, Vt = compute_svd(urm, K) uTest = [4, 5, 6, 7, 8, 73, 23] # uTest=[1b5bb32767963cbc215d27a24fef1aa01e933025] uTest_recommended_items = compute_estimated_matrix(urm, U, S, Vt 继续将这段代码输出完整

import pandas as pd import math as mt import numpy as np from sklearn.model_selection import train_test_split from Recommenders import SVDRecommender triplet_dataset_sub_song_merged = triplet_dataset_sub_song_mergedpd triplet_dataset_sub_song_merged_sum_df = triplet_dataset_sub_song_merged[['user','listen_count']].groupby('user').sum().reset_index() triplet_dataset_sub_song_merged_sum_df.rename(columns={'listen_count':'total_listen_count'},inplace=True) triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_merged,triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_merged['fractional_play_count'] = triplet_dataset_sub_song_merged['listen_count']/triplet_dataset_sub_song_merged small_set = triplet_dataset_sub_song_merged user_codes = small_set.user.drop_duplicates().reset_index() song_codes = small_set.song.drop_duplicates().reset_index() user_codes.rename(columns={'index':'user_index'}, inplace=True) song_codes.rename(columns={'index':'song_index'}, inplace=True) song_codes['so_index_value'] = list(song_codes.index) user_codes['us_index_value'] = list(user_codes.index) small_set = pd.merge(small_set,song_codes,how='left') small_set = pd.merge(small_set,user_codes,how='left') mat_candidate = small_set[['us_index_value','so_index_value','fractional_play_count']] data_array = mat_candidate.fractional_play_count.values row_array = mat_candidate.us_index_value.values col_array = mat_candidate.so_index_value.values data_sparse = coo_matrix((data_array, (row_array, col_array)),dtype=float) K=50 urm = data_sparse MAX_PID = urm.shape[1] MAX_UID = urm.shape[0] recommender = SVDRecommender(K) U, S, Vt = recommender.fit(urm) Compute recommendations for test users uTest = [1,6,7,8,23] uTest_recommended_items = recommender.recommend(uTest, urm, 10) Output recommended songs in a dataframe recommendations = pd.DataFrame(columns=['user','song', 'score','rank']) for user in uTest: rank = 1 for song_index in uTest_recommended_items[user, 0:10]: song = small_set.loc[small_set['so_index_value'] == song_index].iloc[0] # Get song details recommendations = recommendations.append({'user': user, 'song': song['title'], 'score': song['fractional_play_count'], 'rank': rank}, ignore_index=True) rank += 1 display(recommendations)这段代码报错了，为什么？给出修改后的代码

triplet_dataset_sub_song_merged = pd.merge(triplet_dataset_sub_song_merged,triplet_dataset_sub_song_merged_sum_df) triplet_dataset_sub_song_merged['fractional_play_count'] = triplet_dataset_sub_song_...

python数据分析与可视化 import pandas as pd import numpy as np import m

import pandas as pd import numpy as np import matplotlib.pyplot as plt # 创建示例数据 data = pd.DataFrame({ 'A': np.random.randn(1000), 'B': np.random.randn(1000), 'C': np.random.randn(1000), }) ...

import pandas as pd.docx

import pandas as pd import numpy as np - **Pandas**: 一个强大的数据分析与处理库。 - **NumPy**: 用于进行数值计算的 Python 库。 #### 2. 读取 CSV 文件到 DataFrame python wine_data = pd.read_csv('...

import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip

这个压缩包文件"import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip"包含了使用Python的NumPy库进行SPI计算的代码，以及可能的MATLAB实现。首先，我们要了解NumPy在Python中的重要性。...

Numpy及Pandas_numpy_pandas_dataframe_python_

Numpy和Pandas是Python中两个非常重要的数据分析和处理库，它们在科学计算领域有着广泛的应用。Numpy主要处理多维数组对象，而Pandas则在此基础上构建了更高级的数据结构，如DataFrame，用于进行数据清洗、分析和...

03_NumPy_and_Pandas_pandas_

标题 "03_NumPy_and_Pandas_pandas_" 暗示了这个压缩包包含的是关于NumPy和Pandas库的基础知识。这两个库是Python中数据分析和处理的核心工具，特别是对于处理大型数据集非常有用。Pandas是建立在NumPy之上的，提供...

numpy-1.19.5-cp##-cp##-win_amd64.rar

pip install numpy-*** 选择对应的离线安装包 numpy-1.19.5-cp36-cp36m-win_amd64.whl numpy-1.19.5-cp37-cp37m-win_amd64.whl numpy-1.19.5-cp38-cp38m-win_amd64.whl numpy-1.19.5-cp39-cp39m-win_amd64.whl

import numpy as.docx

在Python编程语言中，numpy 是一个非常重要的科学计算库，它提供了强大的数组操作功能。在本示例中，我们看到代码导入了numpy库，并用别名 np 来引用它。这样做的目的是方便后续代码中调用numpy的功能，如创建、...

clear_use_numpy_pandas_graph

标题 "clear_use_numpy_pandas_graph" 暗示着这个压缩包可能包含一系列关于使用Python中的NumPy、Pandas和图形库（可能是matplotlib或其他类似库）的教程或代码示例。这些工具在数据分析和可视化领域中是至关重要的...

dataanaly 2_numpy_pandas_python3数据库_python_产品经理_

包含数据的基本处理运算拟合数据展现 Python3.6及以上版本 anoconda管理Python环境文件夹day01 包含向量元组 pandas的基本用法及部分数据的分析过程和示例文件夹plot 包含plot的绘制示例文件夹pyweb 以webpy...

pandas_numpy_seed.ipynb

seed()方法在去随机数在下次编译不会重置，即得到的值是一样的

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_

import numpy/pandas in python-d 错误解决

对于开发版本的python存在numpy和pandas无法正常导入的问题，卸载原有的numpy和pandas，将文件夹内内容拷贝到python_d.exe所在目录下的Lib/site-packages目录下

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

import pandas as pd # 假设df是我们的数据集 df = pd.read_csv('your_dataset.csv') # 设置训练集和测试集的比例，例如80%的数据用于训练，20%用于测试 train_size = 0.8 test_size = 1 - train_size # 使用随机...

Python_mat.numpy.pandas-numpy

24/8matploatlibnumpypandas numpy numpy numpy numpy numpy

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码.zip

标题中的"dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码"表明这是一个关于数据分析的项目，主要使用的工具是NumPy、Pandas和Python，这是一门强大的科学计算库组合，广泛应用于数据预处理、清洗、分析...

pandas.read_csv参数全面解读与实用示例

pandas.read_csv是Python中Pandas库中一个非常重要的函数，用于从CSV文件中读取数据并将其转换为DataFrame对象，这是一种在数据分析中广泛使用的数据结构。本文将详细介绍pandas.read_csv函数的参数及其作用，以便...

相关推荐

Pandas Excel操作：read_excel与to_excel函数详解

Pandas透视表（pivot_table）深度解析与应用

pandas库read_csv、rolling、expanding函数详解及实践

python数据分析与可视化 import pandas as pd import numpy as np import m

import pandas as pd.docx

import numpy as np_SPI干旱识别_spi_SPI6_matlabimportnumpy_测试_源码.zip

Numpy及Pandas_numpy_pandas_dataframe_python_

03_NumPy_and_Pandas_pandas_

numpy-1.19.5-cp##-cp##-win_amd64.rar

import numpy as.docx

clear_use_numpy_pandas_graph

dataanaly 2_numpy_pandas_python3数据库_python_产品经理_

pandas_numpy_seed.ipynb

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_

import numpy/pandas in python-d 错误解决

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

Python_mat.numpy.pandas-numpy

dataanaly_numpy_pandas_python_sebo301.com4_数据分析_源码.zip

pandas.read_csv参数全面解读与实用示例

最新推荐

python中时间转换datetime和pd.to_datetime详析

pandas中read_csv的缺失值处理方式

Pandas的read_csv函数参数分析详解

YOLO算法-城市电杆数据集-496张图像带标签-电杆.zip

(177406840)JAVA图书管理系统毕业设计(源代码+论文).rar

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程