df_1['label'] = 1 # df_1['入网时长(月)'] = data_to_month(df_1, cfg_dict) # df_0 = pd.read_pickle('sample/easy_sample_neg_std.pickle') # df_0 = pd.read_pickle('sample/easy_sample_neg.pickle') df_0 = pd.DataFrame() for root, dirs, files in os.walk('sample/tmp_zq_yf_easy_sample_neg/'): files = [f for f in files if not f[0] == '.'] for file in files: print('read from => %s%s' % (root, file)) tmp = pd.read_csv('sample/tmp_zq_yf_easy_sample_neg/' + file, header=None, encoding='utf-8') df_0 = df_0.append(tmp) df_0.columns = ['号码', '用户状态', '用户星级', '入网时长(月)', '是否历史投诉用户', '是否黑名单&免打扰', '证件性别', '证件年龄', '是否集团网用户', '是否校园用户', '是否双卡槽终端
时间: 2024-02-04 08:02:47 浏览: 85
Attacks.rar_1DF_6X5_NOO_R2L_vdf
这段代码是用来加载另一个数据集 df_0 的代码。
首先,代码给 df_1 数据框添加了一个名为 'label' 的列,并将所有行的值都设置为 1。这可能是为了标记 df_1 中的样本为正例。
接着,代码创建了一个空的数据框 df_0。
然后,通过 os.walk 函数遍历指定目录下的文件,获取文件列表。在遍历过程中,排除以点开头的隐藏文件。
对于每个文件,代码使用 pd.read_csv 函数读取文件内容,并将其追加到 df_0 数据框中。
最后,代码给 df_0 数据框添加列名,列名为 ['号码', '用户状态', '用户星级', '入网时长(月)', '是否历史投诉用户', '是否黑名单&免打扰', '证件性别', '证件年龄', '是否集团网用户', '是否校园用户', ...]。
这段代码的作用是加载另一个数据集 df_0,并为其添加列名。根据代码中的注释,df_0 数据集可能包含了负例样本。
阅读全文