# 计算PSM psm_df:DataFrame = (user_df.select( # 用户id user_df["userId"], # PSM ( # 优惠订单占比 (F.col("tdon") / user_df["ton"]) + # 平均优惠金额占比 ((user_df['tda'] / user_df['tdon']) / (user_df['tra'] / user_df['ton'])) + # 优惠金额占比 (user_df['tda'] / user_df['tra']) ).alias("psm") ) .where(f"{F.col('psm')} is not null") )
时间: 2024-02-10 22:22:33 浏览: 191
PSM.zip_pic18f_psm软件
你这段代码是在计算用户的 PSM 值,其中 PSM 是指“Purchase Sensitivity Metric”,购买敏感度指标。这个指标通过计算用户的优惠订单占比、平均优惠金额占比和优惠金额占比来反映用户在购物时对价格敏感的程度。这个代码通过使用 PySpark 的 DataFrame API,对每个用户进行 PSM 值的计算,并且过滤掉 PSM 值为 null 的用户。
阅读全文