savaData(mediamatch_userevent.filter(ownerFilter).filter(smnameFilter).filter(runFilter).distinct(),"userevent") savaData(order_index.filter(ownerFilter).filter(smnameFilter).filter(runFilter).distinct(),"order") savaData(mediamatch_usermsg.filter(ownerFilter).filter(smnameFilter).filter(runFilter).distinct(),"usermsg") savaData(mmconsume_billevents.filter(ownerFilter).filter(smnameFilter).distinct(),"billevents") savaData(media.filter(ownerFilter).filter(smnameFilter).filter("duration>4000 and duration<21600000") .filter("res_type !='0' and origin_time not rlike '00$' and end_time not rlike '00$'").distinct(),"media")
时间: 2023-12-22 15:41:54 浏览: 162
这段代码看起来是对数据进行了多次过滤,并分别保存了不同的数据集到不同的文件中。具体来说:
- 第一行代码对名为 mediamatch_userevent 的数据集进行了三次过滤,分别是对 owner_name、sm_name 和 run_name 进行过滤,然后使用 distinct() 方法去重,最后将结果保存到名为 userevent 的文件中。
- 第二行代码对名为 order_index 的数据集进行了三次过滤,分别是对 owner_name、sm_name 和 run_name 进行过滤,然后使用 distinct() 方法去重,最后将结果保存到名为 order 的文件中。
- 第三行代码对名为 mediamatch_usermsg 的数据集进行了三次过滤,分别是对 owner_name、sm_name 和 run_name 进行过滤,然后使用 distinct() 方法去重,最后将结果保存到名为 usermsg 的文件中。
- 第四行代码对名为 mmconsume_billevents 的数据集进行了两次过滤,分别是对 owner_name 和 sm_name 进行过滤,然后使用 distinct() 方法去重,最后将结果保存到名为 billevents 的文件中。
- 第五行代码对名为 media 的数据集进行了多次过滤,其中包括对 owner_name、sm_name 进行过滤,以及对 duration、res_type、origin_time、end_time 进行过滤,然后使用 distinct() 方法去重,最后将结果保存到名为 media 的文件中。
这些代码可能是为了对数据进行预处理,以便后续的分析和建模。
阅读全文