def _init_dataset(self): self.Xs = [] self.user_book_map = {} for i in range(self.user_nums): self.user_book_map[i] = [] for index, row in self.df.iterrows(): user_id, book_id = row self.user_book_map[user_id].append(book_id) if self.mode == 'training': for user, items in tqdm.tqdm(self.user_book_map.items()): for item in items[:-1]: self.Xs.append((user, item, 1)) for _ in range(3): while True: neg_sample = random.randint(0, self.book_nums-1) if neg_sample not in self.user_book_map[user]: self.Xs.append((user, neg_sample, 0)) break elif self.mode == 'validation': for user, items in tqdm.tqdm(self.user_book_map.items()): if len(items) == 0: continue self.Xs.append((user, items[-1]))
时间: 2023-12-06 15:42:49 浏览: 67
delphi_dataset.zip_connect_dataset_dataset delphi_delphi dataset
这段代码是用于初始化数据集的。它首先创建了一个空列表 `self.Xs` 和一个字典 `self.user_book_map`,用于存储用户与书籍的映射关系。然后遍历数据集中的每一行,将用户ID和书籍ID添加到 `user_book_map` 中。如果模式为训练模式,它会遍历每个用户和用户拥有的书籍,为每个正样本(用户和书籍之间有交互)添加标签 `1`,并为每个负样本(用户和书籍之间没有交互)添加标签 `0`。为了生成负样本,它使用随机数生成器从不属于该用户的书籍集合中随机选择一个样本。如果模式为验证模式,它会为每个用户的最后一个书籍添加标签,并将其添加到 `self.Xs` 中。
阅读全文