def load_data(cfg_dict): # df_1 = pd.read_pickle('sample/easy_sample_pos_std.pickle') # df_1 = pd.read_pickle('sample/easy_sample_pos.pickle') df_1 = pd.DataFrame() for root, dirs, files in os.walk('sample/tmp_zq_yf_easy_sample_pos/'): files = [f for f in files if not f[0] == '.'] for file in files: print('read from => %s%s' % (root, file)) tmp = pd.read_csv('sample/tmp_zq_yf_easy_sample_pos/' + file, header=None, encoding='utf-8') df_1 = df_1.append(tmp) df_1.columns = ['号码', '用户状态', '用户星级',
时间: 2024-04-18 18:32:58 浏览: 138
UCOS-II的OS_CFG.H文件中各种定义的说明和设置
5星 · 资源好评率100%
这段代码是用来加载数据的函数。根据配置字典 cfg_dict 中的设置,从指定目录中读取数据文件并将其合并为一个数据框 df_1。
首先,函数创建一个空的数据框 df_1。
然后,通过 os.walk 函数遍历指定目录下的文件,获取文件列表。在遍历过程中,排除以点开头的隐藏文件。
接下来,对于每个文件,函数使用 pd.read_csv 函数读取文件内容,并将其追加到 df_1 数据框中。
最后,函数给 df_1 数据框添加列名,列名为 ['号码', '用户状态', '用户星级', ...]。
这段代码的作用是从指定目录中读取多个数据文件,并将它们合并为一个数据框。这样可以方便后续对数据进行处理和分析。
阅读全文