def gen_basic_user_feat(): """ 用户基本特征 """ dump_path = 'cache/user_feature/basic_user_feat.pkl' if os.path.exists(dump_path): user = pickle.load(open(dump_path, 'rb')) else: user = pd.read_csv(users, encoding='gbk') user['age'] = user['age'].replace({'-1': 0, '15岁以下': 1, '16-25岁': 2, '26-35岁': 3, '36-45岁': 4, '46-55岁': 5, '56岁以上': 6, })
时间: 2024-02-10 11:35:36 浏览: 158
这是一个Python函数,用于生成用户的基本特征。函数首先会检查本地是否已经存在缓存的用户特征数据,如果存在则直接从文件中读取数据,否则从指定路径读取原始的用户数据,并进行数据清洗和预处理操作。这里的用户数据是一个CSV格式的文件,通过pandas库读取后,将年龄字段的取值范围进行了映射,将字符串类型的年龄数据映射为数字类型,方便后续的数据分析和建模。最后,函数会将生成的用户特征数据进行缓存,以便下次直接使用。
阅读全文