cols = df.columns.tolist() print(len(cols)) df = df[[ # 'UserId', 'ActivityCount', 'ActivityKeep', 'ActivityUsed', 'IntegralCurrentPoints', 'IntegralUsed', 'IngegralTotal', 'IntegralFrequency', 'IntegralAvgPointsDay', 'IntegralScanCount', 'IntegralScanTotal', 'IntegralScanFrequency', 'IntegralCheckinCount', 'IntegralCheckinFrequency', 'OrderCount', 'OrderFrequency', 'OrderItemCount', 'OrderAvgPrice', 'OrderProvinceCity', 'OrderAvgPoint', 'BabyCount', 'User_iCreator', 'ClientCode', # 'MemberState', 'LoyaltyIsAutoLost'] ]

时间: 2023-10-23 20:06:51 浏览: 45

这段代码首先获取了数据集df中所有列的名称，并输出了列的数量。接着，使用df[[...]]的方式对数据集中的某些列进行了筛选，只保留了一部分列，包括： - ActivityCount：用户活动总数 - ActivityKeep：用户活动留存数 - ActivityUsed：用户活动使用数 - IntegralCurrentPoints：用户当前积分 - IntegralUsed：用户已使用积分 - IngegralTotal：用户总积分 - IntegralFrequency：用户积分获取频率 - IntegralAvgPointsDay：用户平均每日积分获取量 - IntegralScanCount：用户扫码次数 - IntegralScanTotal：用户扫码总数 - IntegralScanFrequency：用户扫码频率 - IntegralCheckinCount：用户签到次数 - IntegralCheckinFrequency：用户签到频率 - OrderCount：用户订单数 - OrderFrequency：用户下单频率 - OrderItemCount：用户订单商品数 - OrderAvgPrice：用户订单平均价格 - OrderProvinceCity：用户下单省市 - OrderAvgPoint：用户订单平均积分 - BabyCount：用户宝宝数量 - User_iCreator：用户渠道 - ClientCode：用户客户端代码 - LoyaltyIsAutoLost：用户是否自动流失这个过程可以用来过滤掉不必要的列，只保留与目标变量（LoyaltyIsAutoLost）有关的列，以便进行后续的数据分析和建模。

阅读全文

相关推荐

# Python中numpy库中，X,Y = np.meshgrid(x,y)最详细理解（附理解代码）

C++调用Eigen库技巧的直观理解 (2).pdf

numeric_cols = results.select_dtypes(include=['float', 'int']).columns.tolist() results[numeric_cols] = results[numeric_cols].apply(lambda x: x.map(lambda y: '{:.2f}%'.format(y * 100))) results将百分比后的字符型转变为整型

num_cols = raw_data.columns.select_dtypes(include=[DoubleType]).tolist()报错'list' object has no attribute 'select_dtypes'，请修改

num_cols = raw_data.select_dtypes(include='number').columns.tolist()报错'DataFrame' object has no attribute 'select_dtypes'，请修改

基于Matlab面板版的卡尔曼小球运动跟踪[Matlab面板版].zip

Day01(1).py

面试-PHP高频面试题整理-面试题合集.zip

最新推荐

基于Matlab面板版的卡尔曼小球运动跟踪[Matlab面板版].zip

WPF渲染层字符绘制原理探究及源代码解析

管理建模和仿真的文件

Twisted.trial：深入探索单元测试框架的内部工作机制

根据设定的阈值（比如一定百分比的相似度），判断二维码内容和图片内容是否匹配代码

海康精简版监控软件：iVMS4200Lite版发布

"互动学习：行动中的多样性与论文攻读经历"

【Twisted.trial入门指南】：掌握Python单元测试的10个基本概念

visual studio编写scanf

自动化脚本在lspci-TV的应用介绍