没有合适的资源?快使用搜索试试~ 我知道了~
首页2017B题-基于聚类分析的双目标优化定价模型——戴澄洁等(华中科技大学,本科组高教社杯获得者)
资源详情
资源评论
资源推荐

1
基于聚类分析的双目标优化定价模型
摘要
“拍照赚钱”APP 是基于移动互联网的自助式劳务众包平台,使得企业可利
用大众力量,低成本、高效率地完成各种商品检查与信息搜集的任务。本文通过
建立数学模型,就 APP 中的任务定价问题进行分析,给出最优的任务定价方案。
针对问题一,对项目的任务定价规律进行定性与定量研究。利用 Matlab 的
cftool 工具箱绘制出任务的经纬度坐标与定价数据的三维拟合图,观察到任务
分布密集的地区任务定价较低。对任务的位置数据进行空间离散化处理和
K-Means 分析,将任务分布的区域等划分为若干网格区域,定义影响任务定价的
四个因子,即网格内任务数量、会员人数、会员平均完成能力、任务与中心点的
距离。运用灰色关联矩阵定量分析四个影响因子与定价的相关度,分别为
0.9710,0.9671,0.9633,0.9390。得出所定义的指标对定价相关性很高,能较好
描述定价规律。最后通过比较未完成任务与已完成任务的相关度矩阵得出距离对
任务的完成的影响是最显著的。
针对问题二,设计新的任务定价方案实际上是一个优化问题,以总成本最小
化,完成率最大化作为两个优化目标。通过问题一中任务未完成的原因分析引入
吸引度矩阵,计算吸引力阈值。考虑到每个会员有各自的信誉值,预定开始时间
与预定配额,设定最大吸引准则、竞争准则、信誉优先分配准则、时间列准则,
约束条件即为会员在预定任务时必须遵循以上准则,建立双目标定价优化模型。
利用 Matlab 的深度多重搜索算法对决策变量进行遍历,用 matlab 得到最优定价
方案。此定价方案的完成率为 84.55%,与原方案比较,总成本节约了 5.58%,任
务完成率提高了 32.25%。
针对问题三,在位置较为集中的任务被联合打包发布的情况下修改双目标定
价优化模型。首先,根据任务的位置信息,利用聚类分析将任务分为 150 类,提
取出包含的任务数量大于 15 个的任务类别,进行二次嵌套聚类分析,由此得到
的任务打包方案满足每一个任务包中的任务位置集中且任务数量不超过 15 个。
然后,修改吸引力矩阵,重新计算得到每个任务的阈值,基于任务打包结果,在
满足双目标优化模型的约束条件的情况下,利用 Matlab 的深度多重搜索算法对
决策变量进行遍历,得到最优定价方案,在此定价方案下,任务完成率为 0.9091%,
与问题二中的方案相比,总成本节约了 5.7%,任务完成度提高了 7.52%。
针对问题四,新项目的任务定价方案设计应当基于之前建立的双目标优化定
价模型。首先,根据任务的位置信息进行聚类分析,得到新任务的打包方案。将
模型三中的相关任务数据以及最优定价方案作为 BP 神经网络的训练样本,建立
BP 神经网络预测模型,新任务的定价依旧满足问题二中的约束条件,通过预测
得到新任务定价方案以及相应完成情况,最终定价总额为 54603.58 元,150 包
中完成 141 包,任务完成率为 94%。都优于问题二和问题三的最优定价方案。
最后,给出每个模型的优缺点及评价。
关键词:K-Means 聚类分析 双目标优化模型 多重搜索算法 BP 神经网络

2
一、问题重述
1.1 问题背景
在互联网技术发展迅猛的当下,高昂的技术、人才、设备等成本在一定程度
上限制了一批企业的生产和扩大,这也促使企业重新寻找突破点。2015 年 9 月,
国务院印发的《关于加速构建大众创业万众创新支撑平台的指导意见》中提出,
积极发展众包,即汇众力增就业,借助互联网等手段,将传统由特定企业和机构
完成的任务向自愿参与的所有企业和个人进行分工,最大限度利用大众力量,以
更高的效率、更低的成本满足生产及生活服务需求。
“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载 APP,注册
成为 APP 的会员,然后从 APP 上领取需要拍照的任务,赚取 APP 对任务所标定
的酬金。这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查
和信息搜集,相比传统的市场调查方式节省了调查成本,保证了调查数据真实性,
缩短了调查的周期。因此 APP 成为该平台运行的核心,同时,APP 中的任务定价
是其核心要素。如果定价不合理,该项商品调查任务就会无人领取,从而失败。
1.2 问题提出
根据以上背景,以及给出的三个附件,需要解决以下问题:
1.研究附件一中项目的任务定价规律,分析任务未完成的原因。
2.为附件一中的项目设计新的任务定价方案,并和原方案进行比较。
3.实际情况中,用户可能会争相选择位置比较集中的多个任务,因此,考虑
将这些任务联合在一起打包发布。基于这种考虑,修改前面的定价模型,并分析
对最终的任务完成情况的影响。
4.对附件三中的新项目给出任务定价方案,并评价该方案的实施效果。
其中,附件一给出了已结束项目任务数据,包含每个任务的位置、定价和完
成情况;附件二给出了会员信息数据,包含会员的位置、信誉值以及对应的任务
开始预订时间和预定限额;附件三给出了新项目任务数据,仅包含任务的位置信
息。
二、问题分析
2.1 问题一的分析
问题一首先要求我们根据一项已完成项目的任务数据中的每个任务的位置、
定价和完成情况来分析任务定价规律。在经济学中,一个竞争性市场上的商品价
格规律受到供求关系影响而上下波动,因此,要分析定价规律,便需要找到影响
定价的因素,对于每一个任务而言,它的定价与完成情况会受到其它任务与会员
的影响,我们将从这两大方面考虑任务定价的影响因子,定义影响任务定价的四
大影响因子。
首先,我们将利用任务数据的经纬度与定价信息来进行图像分析,观察出定
价的定性规律,在此基础上,将标定任务位置的空间数据进行离散化处理,并根
据任务的位置分布进行 K-Means 聚类分析,结合附件一给出的数据将影响因子量
化。最后,利用灰色关联度矩阵计算各影响影响因子与定价之间的相关度,定量

3
分析任务的定价规律。通过比较未完成任务与已完成任务的相关度矩阵之间的差
异找出任务未完成的原因。
2.2 问题二的分析
问题二的新的定价方案设计问题实际上是一个优化问题。由于附件一中任务
定价存在某种不合理性导致了任务完成率低下,从企业定价的角度考虑,一个较
优的定价方案应当让企业花费尽可能少的成本去得到更多的市场调查信息。因此,
我们将设计新的定价方案看做一个双目标优化问题,即在各种约束条件下设计出
一个可以使得成本最小化、任务完成率最大化的定价方案。
在考虑最优定价方案时,不能完全从发布任务的企业角度来考虑,应当考虑
到现实中任务被会员预定的过程中存在的规则。当企业发布任务数据后,不是任
务挑选会员,而是会员挑选任务。该问题的难点便在于同时从企业和会员的两个
角度进行考虑,将复杂的任务预定规则一一转化为约束条件。由于每个会员都有
对应的信誉值以及任务开始预定时间和预定限额,并且信誉值越高,越优先挑选
任务。我们按照时间顺序,依次对任务预定的时间点进行分析。建立每个任务对
每位会员的吸引度矩阵,设立每个任务的吸引度阈值,设定约束条件,求解双目
标优化模型。
2.3 问题三的分析
问题三考虑到将位置比较集中的任务联合打包分布,因此,首先应当基于任
务的经纬度信息,给出一个合理的打包方案,即如何判断哪些任务应当被打包发
布。我们利用聚类分析法的思想,依据任务的地理坐标对任务进行分类,确定一
个合理的打包方案。
依据打包方案将任务进行联合打包后,问题三实质上就可以转化为大致等同
于问题二的双目标优化定价模型,要想对前面的定价模型进行修改,首先要明确
将任务打包处理后会对哪些因素产生影响从而影响到定价。经分析可知打包处理
后的任务与之前的任务相比,任务与会员之间的距离矩阵、任务对会员的吸引度
矩阵、任务吸引度阈值均会发生改变,从而影响到优化定价模型的约束条件,最
终将影响目标函数的求解,即定价方案。我们基于双重聚类分析给出的打包方案
求解出新的距离矩阵、吸引度矩阵以及阈值,对前面的定价方案进行修改,给出
任务联合打包发布情况下的优化定价方案。
2.4 问题四的分析
问题四要求给出附件三中的新项目的任务定价方案,任务数据只有位置信息。
考虑任务定价方案基于模型三的定价模型。模型三的结果与决策变量之间存在潜
在机制,找到模型三影响定价与完成情况的因子之后,把影响因子的数值与定价、
完成情况作为 BP 神经网络的训练样本,从而建立 BP 神经网络预测模型,仿照
模型一和模型三,对新任务分别进行聚类分析,得到影响因素的值,并作为神经
网络预测样本。然后通过预测就能够得到新任务打包下的定价以及相应完成情况。

4
三、基本假设
1.假设会员在预定任务时,优先预定对其吸引度最大的任务;
2.假设当多个会员同时想预定同一任务时,信誉值最高的会员优先获得该任务;
3. 假设题目给出的数据真实可靠。
四、符号说明
符号
说明
单位
k
cp
会员
k
的任务完成能力
/
i
cp
任务
i
所在的单位网格内的会员平均完成能力
/
i
p
第
i
个任务的定价
元
i
C
判断任务
i
是否被完成的 0-1 变量
/
ij
W
任务对会员的吸引度矩阵
/
ij
w
任务
i
对会员
j
的吸引度
/
ij
l
任务
i
与会员
j
之间的距离
公里
i
w
任务
i
的吸引度阈值
/
( )choice j
会员
j
在预定任务时的选择
/
( )belong k
用于表示任务
k
被哪位会员成功预订
/
( )G j
会员
j
的信誉值
/
注:未列出符号及重复的符号以出现处为准
五、问题一的模型建立与求解
5.1 问题的分析
问题一首先要求我们根据一项已完成项目的任务数据中的每个任务的位置、
定价和完成情况来分析任务定价规律,首先,为了清晰直观地观察每个任务的位
置与定价信息,将每个任务的经纬度信息导入百度地图,做出每个任务的经纬度
与定价的三维拟合图,通过观察得到直观的定性规律。

5
每个任务的定价受到其周围任务的数量、会员的人数分布及其信誉属性的影
响,为了定量分析这种影响,首先将每个任务的位置信息,即空间数据,进行离
散化处理。找出任务所在的经纬度范围作为总区域,将总区域划分为若干单位网
格,以便统计每个网格内的任务数据与会员数据。由于任务分布范围较广,定价
规律可能存在分布区域间的差异,因此,根据任务的经纬度坐标对这些散布的位
置点进行 K-Means 聚类分析,得到位置分布相近的任务簇与中心点。接着,确定
对任务定价产生影响的四大因子,根据空间数据离散化处理与 K-Means 分析的结
果将影响因子量化。得到影响因子的数值后,结合任务的定价数据,利用灰色关
联度矩阵来分析每个影响因子与任务定价之间的相关度,得到任务定价规律的量
化结果。
最后,由于未完成任务与已完成任务的相关度矩阵之间一定存在某种差异,
通过比较它们之间的差异找出任务未完成的原因。
具体的思路流程图如下:
图 1 问题一的思路流程图
5.2 模型的建立
5.2.1 基于地图拟合的定性分析
首先,将附件一中提供的已结束的每个任务的经纬度数据导入 EXCEL 表格中,
并进行相应的数据处理,检验并排除掉异常数据之后,将得到的任务经纬度数据
剩余50页未读,继续阅读








安全验证
文档复制为VIP权益,开通VIP直接复制

评论0