在线评论对离散选择模型内隐问题的影响

33 浏览量更新于2023-12-07 收藏 879KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

数据科学与管理2（2021）1研究文章在线评论对解决离散选择模型中的内隐问题的影响谭新龙a，*，肖玉明ba贝叶斯数据智能技术服务有限公司，中国Xi'an，710075b蜀云信息技术有限公司，杭州，310063，中国A R T I C L E I N F O保留字：在线评论Endobox离散选择模型智能手机情感分类A B S T R A C T本文研究了在线评论在解决智能手机消费需求中的价格内生性问题上的有效性我们认为审查变量作为替代品的未观察到的产品质量的标量变量在以前的方法。基于方面的情感分类技术旨在从数百万的评论内容中构建与特征相关的评论变量我们讨论了评价变量在享乐定价模型和条件logit离散选择模型中的表现。我们的研究结果表明，评论变量表现出良好的性能，无论是作为价格的工具，或作为显式控制变量的需求模型。具体而言，定价预测准确度提高了3.4%，这被认为是预测实践的重大改进在离散选择模型中，估计的价格系数在没有内禀修正的情况下偏向正方向在纳入审查变量后，按预期方式进行调整。研究结果表明，在线评论为离散选择模型中的内隐问题提供了替代信息来源。我们还分析了不同的消费者的偏好和需求的差异，提供一些实际的营销含义。1. 介绍在典型的耐用品消费需求离散选择模型中，当省略的变量与包含的属性（特别是价格）相关时，就会发生内隐性，从而导致标准独立假设下的不一致性（Berry，1994）。在以前的文献中，由于数据可用性或无法量化的特征，研究人员无法捕捉产品验证的所有方面。如今，电子商务购物内容的爆炸式增长，加上自然语言处理（NLP）等方法，为研究人员和从业人员提供了令人兴奋的机会，以利用有关产品的更有价值的信息。随着网络购物的普及，消费者将自己的购物体验发布在电子商务平台或零售商网站上，即产品的在线评论。在线评论是产品特征信息的来源之一，越来越受到消费者的重视在线评论为消费者提供了额外的信息，减少了对产品质量的不确定性，提高了消费者需求的匹配度（Wang和Wang，2020）。在线评论还包括由消费者观察到但不由计量经济学家测量的期望属性，例如智能手机的电池性能。通常，这些信息不能从产品的物理属性中获得因此，我们假设，如果所有以前未观察到的属性可以从在线评论中测量，那么需求模型中的内隐问题可能会得到解决或在一定程度上得到缓解。情感分类是NLP中最基本和最活跃的领域情感分类是情感分析中的细粒度任务，旨在识别文本中明确给出随着人工智能技术的日益发展，已经开发了许多用于方面级情感分类的机器学习方法（例如，Gao等人，2019年; Lee等人， 2017; Sun等人， 2019年; Zhang等人， 2019年）。新技术使我们能够从在线评论中提取重要的特征级信息，这些信息超出了以往研究中可观察或可测量的属性。例如，考虑一下智能手机设计的时尚性设计风格影响消费者的选择，但不能直接衡量。现在，在线评论提供了可以工作的信息来源同行评议由Xi交通大学负责* 通讯作者。电子邮件地址：Xinlong. bayesba.com（X. Tan）。[1]参见Zhang et al.（2019）关于方面级情感分类的详细描述。https://doi.org/10.1016/j.dsm.2021.02.006接收日期：2020年10月30日;接收日期：2021年2月9日;接受日期：2021年2021年3月9日网上发售2666-7649/©2021 Xi'an Jiaotong University.出版社：Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表数据科学与管理杂志主页：www.keaipublishing.com/en/journals/data-science-and-managementX.谭，Y。萧数据科学与管理2（2021）12作为时尚设计的代表我们可以使用情感分析构建几个指标例如，两个变量，外观和手感，来自审查数据，可以用作代理的设计水平2正面评价以正面评价的数量占正面评价和负面评价之和的比例来衡量，正面评价和负面评价反映了第一印象时对整体设计的满意程度以及他们对每个产品选项的材料和重量因此，本研究的目的是探讨在线评论在解决智能手机消费者需求的应用程序中的价格内生问题的有效性而不是识别未观察到的产品质量的标量变量，如在以前的方法中看到的，我们明确表示控制变量作为功能相关的审查变量的函数。评论变量是使用基于方面的情感分类技术从产品评论中得出的。建立了一个特征定价模型来检验评论变量对价格的相对重要性和预测能力然后，本文讨论了审查变量的性能，在解决内分泌疾病的发展条件logit离散选择模型，使用个人水平的数据。此外，我们还分析了个人偏好和需求的差异，以提供一些营销的实际意义。结果表明，评论变量可以解释超过82%的交易价格的方差它揭示了在线评论为研究人员提供了一种寻找价格工具的替代方式具有评论信息的特征定价可以更准确地估计产品属性的隐含价格。此外，定价预测准确度提高了3. 4%，这被认为是预测实践的重大改进通过该方法，从业者可以改进产品设计，并评估技术研究和开发的潜在收入。在离散选择模型中，估计的价格系数在没有内禀修正的情况下偏向正方向。在纳入审查变量后，按预期方式进行调整。研究结果表明，在处理离散选择模型中的内隐问题时，审查提供了替代信息来源。如果研究人员以前未观察到的所有属性都可以从在线评论中测量，那么模型估计量将是一致的。最后，我们发现个体对产品属性表现出显著的异质性偏好该发现可帮助智能手机供应商在推出新产品时通过广告定位目标群体。我们的主要贡献如下。我们建议利用在线评论中隐含的产品特征来解决需求模型中的内隐问题。据我们所知，这是这方面的第一次实验结果表明，在离散选择模型中，重新审视变量对解决价格内生性问题是有效的. 回顾变量表现出良好的性能，无论是作为价格的工具，或作为明确的控制变量的需求模型。结合消费者个人数据、产品属性和在线评论，探讨消费者需求的异质偏好该方法对于研究人员、制造商和零售商在分析消费者偏好、制定产品设计和定价策略以优化效用时考虑在线评论效应具有战略意义。论文的其余部分如下。第二部分简要介绍了与本研究相关的文献。第3节描述了2. 文献综述在本节中，我们回顾了解决内分泌问题的计量经济学方法的文献并对在线评论和情感分析的相关工作进行了综述。在计量经济模型中，有几种方法被用来解决首先，离散选择模型中最流行的内生修正方法是Berry（1994）和Berry et al.（1995，2004，以下简称BLP）针对市场层面和消费者层面数据开发的质量控制方法34在BLP类模型中，标量变量在捕获所有未观察到的产品属性方面发挥作用，因此代表整体未测量的质量。总需求方程为它的确定提供了信息来源。正如Berry和Haile（2014）指出的那样，只要有可用的工具，就可以使用市场水平的数据来识别需求函数。适当的工具包括成本转移因素，如市场工资、市场上其他产品的产品特性和其他市场上特定产品的价格。例如，Byrne et al. （2004）通过使用成本数据处理价格对需求冲击的内生性和产出对成本冲击的内生性。Petrin和Train（2010）描述了一种控制函数方法，用于处理离散选择模型中的内隐问题。[5]控制函数方法的基本思想是构造一个变量或控制函数，它以观测到的属性为条件，说明误差项的非零期望值。然后通过在选择效用函数中添加此控制函数作为解释变量来解决内隐问题这种方法的核心是找到合适的工具变量。与BLP相比，Petrin和Train（2010）表明，这两种方法都产生了类似的向下倾斜的需求估计。潜变量方法是另一种用于解释计量经济学模型中未观察到的或潜变量的技术[6]在这种情况下，基本思想是在模型指定中明确包含潜变量，然后在计算每个观察结果的似然性时将其整合出来（Guevara和Ben-Akiva，2010）。具体来说，这是通过将省略的质量属性作为潜在变量显式地包含在效用函数中来实现的。然后使用结构方程或测量方程来描述潜变量的分布7Guevara and Ben-Akiva（2010）分析了控制函数和潜变量方法之间的异同。潜变量技术的一个缺点是由于多重积分的计算而导致的计算负担。在蒙特卡洛实验中，Guevara和Ben-Akiva（2010）发现两阶段控制函数方法优于潜变量方法。如适用，这些方法对从业人员具有限制性，因为难以找到仪器和计算复杂性。因此，我们提出了一种替代方法，使用在线评论，这使得添加隐含的信息，产品功能，从审查到选择模型。先前的研究表明，在线评论可以帮助其他消费者更多地了解产品或服务（Dellarocas，2006; Zhu和Zhang，2010）。在线评论塑造了消费者对产品质量的信念，最终决定了消费者的决定（Vaccari等人， 2020年）。一系列研究集中在研究在线评论的影响上个人层面的数据，并介绍了创建审查变量的过程iables。经验方法在下面的第4节中介绍，而估计结果在第5节中报告。最后一节是对全文的总结。2我们收集了更多与功能相关的评论变量，可以用作设计风格的代理，例如整体设计，相机位置，颜色和边框设计。为了简单起见，我们没有将它们全部包含到模型中。3也称为产品市场控制法。Petrin and Train（2010）[4]另见Goolsbee和Petrin（2004），他们使用消费者层面的数据，将BLP模型应用于消费者在电视选项中的选择。5Guevara和Ben-Akiva（2006年）使用控制功能方法来解决住宅区位选择模型中的内消问题。[6]关于潜变量方法的完整综述可参见Walker和Ben-Akiva（2002）。[7]当我们假设潜变量是观测变量的函数时，使用结构方程。在测量方程中，一些可观测的量或指标被假设为潜变量的函数参见Guevara和Ben-Akiva（2010）的详细例子。X.谭，Y。萧数据科学与管理2（2021）13产品销售（如 Alzate等人， 2021; Cao和Yang，2020; Chen等人，2018;Lee和Choeh，2020）。例如，Liang et al. （2015）和Li et al.（2019）声称对产品的更多正面评价会导致更高的销售额。Li和Shimizu（2018）发现，负面客户评论对在线销售的影响比正面评论大。Wang和Wang（2020）提供了关于在线产品评论的详细文献综述。然而，只有很少的研究探讨了方面层面的再看情绪对消费者选择行为或销售的影响我们的工作重点更多的方面级审查变量和消费者偏好之间的关系。在这方面，审查变量从方面级情感分析过程中产生与我们的工作最密切相关的研究是由Zhang等人进行的。（2015），使用word2vec 8和支持向量机（SVM）对评论文本进行训练和分类。为了说明word2vec对特定领域和汉语的语义特征的捕捉能力，作者使用word2vec对相似特征进行聚类。在此过程中，分别采用基于词典和基于词性的特征选择方法生成训练文件。然而，与我们的工作不同的是，他们只使用相似的特征和语义特征进行文本级情感分类任务。3. 数据中国智能手机行业被选为我们的目标耐用品，因为其日益增长的经济重要性和对电子商务营销的依赖。CAICT9日报告显示，2020年中国智能手机市场销量为3.08亿部与此同时，在线智能手机销售的比例从2016年的18%迅速上升到2020年的35%。2020年，电子商务平台JD.com占智能手机在线销售的49%[10]因此，智能手机代表了一个很好的背景，可以通过处理内分泌来探索在线评论对消费者需求的影响3.1. 个体水平数据在个人层面，我们从中国电信获得了2015年3月至2017年3月期间30，000名客户的月度非均衡面板数据11该样本是从陕西省Xi的所有中国电信客户中随机抽取的Xi作为中国的一个大城市，由于中国互联网的迅速发展，无论是在网上购物还是在网上购物方面都具有代表性居民在网上或网上购物时，都可以很容易地搜索到网上信息。此外，自2015年以来，智能手机行业制造商在为消费者提供改进的功能方面展开竞争比如2020年推出的iPhone 12，甚至重新采用了老产品的外观设计。因此，我们认为该数据集适合在研究消费者需求时探索在线评论对解决内分泌问题的有效性。我们保持15至80岁的个体，占我们样本的99.8%然后，我们只保留个人在整个样本期内的手机使用和人口统计变量的完整我们还减少了990名（7.6%）随着时间的推移重复使用旧手机的人也就是说，我们只保留那些总是使用8Word2vec将大量文本作为输入，并生成一个向量表1消费者特征总结。变量意见是说标准偏差最小最大年龄13,03636.7810.041580男性13,0360.6490.47701忠诚13,0360.9620.19101数据流13,0361.2181.451050.97（GB）付款（100CNY）13,0360.6450.658-0.39218.94最新购买因此，我们有一个平衡的面板数据，包括13,036个人在样本期内。其中，73%和41%的人在抽样期间分别购买了至少一次和两次新手机。消费者特征包括年龄、性别、品牌忠诚度、数据流量和费用。变量描述见表1。品牌忠诚度是指与上个月相比，消费者持有同一品牌的智能手机虽然忠诚度的平均值为96.2%，但在购买新产品的人中，品牌转换行为123.2. 产品属性2007年，iPhone通过提供触摸屏界面和虚拟键盘首款搭载安卓系统的智能手机于二零零八年底推出消费市场。从那时起，由于技术的快速进步，智能手机制造商几乎每年都会为同一产品系列（如iPhone系列）推出新产品。像像素和摄像头这样的特性也得到了显著的改善生产商通过向消费者提供多样化的型号，在价格和功能上进行竞争。13功能的改进和价格的下降是消费者希望购买新智能手机的主要原因。为了进行离散选择研究，我们还从中国电信收集了每部手机的详细信息。原始手机的信息包括设备ID，上市时间，上市价格，每月销售价格，支持的网络类型，屏幕大小，操作系统版本（OS），CPU制造商，CPU型号，CPU Hz，如果是智能手机，前置摄像头像素，后置摄像头像素，品牌，RAM，ROM，分辨率，如果是两张SIM卡，像素等。截至2017年4月，共有1，408款智能手机产品可供选择在将智能手机选项与个人数据和评论数据进行匹配后，我们获得了117种产品进行进一步分析。根据原始智能手机信息，我们构建了以下属性变量，如表2所示。请注意，我们没有将相机的pi X el作为属性变量，因为它与pi X el和分辨率高度相关，并且有很多缺失值。在中国国内智能手机市场，产品通常根据上市价格分为3个部分低端产品对应售价在1,200 CNY以内的智能手机14.高端产品是指标价高于3,000 CNY的产品中档产品都是价格介于两者之间的智能手机因此，37%的智能手机属于低端市场; 45%属于中档市场;高端市场占18%。3.3. 在线审查变量作为我们研究的核心，我们花了七个月的时间在网上收集空间，通常有几百个维度，在空间中为语料库分配相应的向量。另见https：//en.wikipedia.org/wiki/Word2vec。9工信部中国电信研究院。[10]资料来源：前站。https://www.qianzhan.com/analyst/detail/220/201231-98e99cad.html。11出于数据隐私和安全的考虑，我们不再被授权获取中国电信的最新数据或全国代表性数据。12品牌转换的定义是消费者购买一种与前一种品牌不同的新产品。13Cecere等人（2015）研究了智能手机行业硬件组件的演变，发现尽管垂直创新的引入有所收敛，但产品差异化仍然是制造商之间竞争的特征。141美元（USD）兑6.4人民币（CNY）。X.谭，Y。萧数据科学与管理2（2021）14表2智能手机属性摘要。表4评审特征的变量定义变量意见是说标准最小最大变量定义偏差星级评定评论者对焦点智能手机的平均星级挂牌价1172.1481.3190.5886.388质量对重点产品整体质量的平均看法(1000CNY）在评论家之间。屏幕尺寸1175.3140.41246.6备份提到产品的评论者购买的比例为（英寸）紧急情况的替代品RAM（GB）1172.7680.92316成本对重点产品性价比的平均看法ROM（GB）11730.4921.828128性能在评论家之间。CPU GHz1171.6840.3831.22.5外观对焦点设计（包括颜色）的平均情绪八个核心1170.4860.50001跨审查员的产品。CPU手感焦点产品的平均手感情绪PiX el（1 000）1171.3200.2360.8002名评审员。决议(10^6）a1171.8450.8140.5183.686相机焦点对相机性能的平均情绪跨审查员的产品。网数1176.5691.11049存储器焦点产品的内存大小的平均情绪类型在评论家之间。产品龄期（月）b11710.126.957143电池对焦点产品电池寿命的平均看法审稿人。两张sim卡1170.8880.31601信号对焦点产品CPU-海思1170.1810.38501在评论家之间。CPU-Mediatek1170.1870.39001屏幕质量对焦点产品的屏幕质量的平均情绪CPU-1170.5010.50001在评论家之间。高通屏幕尺寸焦点产品屏幕尺寸的平均情绪CPU-三星1170.0540.22601审稿人。操作系统-Android 1170.8800.32501决议对焦点产品解决率的平均情绪OS-Flyme1170.0210.14401在评论家之间。OS-Yun1170.0220.14701语气对说话者的平均情绪和焦点的音质品牌-苹果1170.0770.26601跨审查员的产品。品牌-华为1170.3850.48701操作对焦点产品操作系统的平均情绪品牌-魅族1170.0690.25401系统在评论家之间。品牌-OPPO1170.0510.21901操作对焦点产品运行速度的平均情绪品牌-1170.1980.39901速度在评论家之间。三星加热的焦点产品冷却问题的平均情绪品牌-vivo1170.0320.17601在评论家之间。情绪得分越高，品牌-小米1170.1430.35001满意品牌-1170.0120.10801酷派品牌-中兴117 0.034 0.181 0 1a分辨率是垂直像素Xel和水平像素Xel的乘积b产品年龄定义为自产品推出以来的月数表3iPhone 7上的文本审查内容查看示例要素情感提供评论内容样本和对应的特征情感。这份报告提供了一个新的iPhone 7，并对电池寿命、摄像头、设计、扬声器和屏幕进行了详细的评论。除此之外，评论者对收费给出了轻微的负面评价。此示例还显示审阅者可能会审阅不同的功能。因此，在计算产品的审查变量时，我们对每个变量使用不同的观察结果。我们定义了17个评论变量，如表4所示，这些变量在评论中评论最多。产品质量和定位是由电池寿命是更好的方式为我然后所有以前的手机（包括iPhone 6 Plus）.缺乏快速充电是一个缺点，但我仍然只在晚上充电。相机是辉煌的-爱它。改进的设计和新的颜色是顶级的质量-特别是黑色的。扬声器真的很好。屏幕是惊人的-是的，分辨率是低，但看起来没有任何尖锐。电池正极充电负极摄像机正极正面设计扬声器正面筛选阳性四个审查变量，即，星级、质量、备份和性价比。如果消费者持有智能手机作为替代品，那么该产品通常属于低端群体。成本性能在文本中的定义是，如果产品超过消费者的期望相比，他/她支付的成本。换句话说，性价比反映了消费者的效用。外观和手感对应一个2017年6月之前来自JD.com的评论首先，我们选择了一个与个人数据相吻合的时期，以确保在线评论的可见性或发布时间与消费者第二，这些审查仍然具有代表性，因为环境和市场因素自那时以来没有发生太大变化。通过网络抓取，我们获得了190万条关于智能手机的在线评论。数据包含产品名称、产品ID、用户ID、VIP级别、评分、发布时间和评论内容。我们使用评论数据中的产品名称和产品属性数据中提供的设备ID对来自不同在线零售商的评论进行分组。之后，我们放弃了评论少于400的产品，因为如果样本量太小，评论变量的测量会有很大的噪音评分分数用于计算审阅者的平均星级。其余的评论变量是使用评论内容数据构造的。出于本文的目的，我们希望尽可能多地提取产品的视觉设计。相机衡量消费者对相机图像质量的满意度。从评论中很难区分RAM15因此，我们使用一个单一的变量记忆来表示消费者对这两种产品的情绪。可变电池是对电池容量，电池寿命和充电速度的平均情绪消费者关心的一个重要特性是信号稳定性和强度。这里计算信号变量以表示产品的信号性能，包括WiFi和蜂窝数据。有三个审查变量与屏幕相关。首先，屏幕质量关注屏幕的质量，包括材料（如LCD和OLED），缺陷和亮度。其次，屏幕尺寸是直接的，表示屏幕尺寸是否适合消费者。最后，分辨率代表从消费者的角度来看屏幕分辨率是否足够高作为在线评论中的有用信息。因此，不像现有的研究预测评论内容的情感作为一个整体，我们使每个功能的情感分类从评论分开。表315原因之一是消费者无法区分RAM和ROM在中文中的区别。在大多数情况下，它们使用相同的语句来表示RAM和ROM。X.谭，Y。萧数据科学与管理2（2021）15Fig. 1. 特征级情感分类的框架。SVM：支持向量机表5审查变量总结变量意见是说标准偏差最小最大星级（[0，5]）1174.8100.0724.5974.997质量1170.9130.0640.4551备份1170.0460.06400.316性价比1170.9670.0500.6671外观1170.9910.0140.9331手感1170.9790.0240.8571相机1170.7210.1780.2201存储器1170.5710.26501电池1170.4970.28101信号1170.5110.22401屏幕质量1170.7530.1460.2431屏幕尺寸1170.8960.1020.3381决议1170.7820.22801语气1170.6000.2170.0711操作系统1170.9190.0530.7331运行速度1170.9290.0570.6671加热的1170.7670.25901在表4中定义，音调是对说话者和音质的平均情绪操作系统的性能由两个评价变量反映，操作系统和运行速度。最后，加热意味着手机在运行一段时间后是否会变热。它反映了散热效果是否良好。接下来，我们简要介绍创建表4中列出的评审变量的过程。为此，我们首先进行相似特征聚类和极性词提取的任务。我们采用SVM进行情感分类。图 1说明了该过程的基本框架。16在中文网络评论中，同一个产品的特点可以用不同的词语来表达[17]因此，我们需要将这些领域同义词归为同一个特征组。为此，我们首先采用中文文本分割软件Jieba，将审阅上下文分割为不同的单词。Jieba还用预先定义的词性标签标记每个单词，可以用来删除无意义或停止的单词。删除这些单词和标点符号后，我们得到一个训练文件，其中单词由空格分隔。在第二步中，我们使用word2vec来学习单词的向量表示。最后，Word2vec[16]另见Zhang et al.（2015），他们采用了与我们类似的程序。[17]以外观（外观1）为例，它也可以用下面的词来表示：扬子、杨氏、宽行、宽行、早行和言止。18Word2vec读取向量中的每个单词及其对应的向量通过计算词与词之间的余弦距离，达到同义词聚类的目的。18在情感分类中，我们使用标点符号将每个评论内容划分为句子。我们发现一个句子一次主要表达一个特征。在切分句子之后，我们将它们切分成词，并使用word2vec获得向量在分类之前，我们使用基于词典的方法来选择特征。我们需要构建一个与特征相关的情感词和短语的字典。为此，我们首先通过手动注释为每个特征提取一些积极和消极的词。我们将它们作为输入词，并在word2vec中运行距离命令以获得更多的情感词。因此，我们扩展了原始字典。最后，我们保留特征词和情感词作为最终的训练特征。在前人研究的基础上，本文采用SVM进行情感分类。在机器学习中，SVM是最好的监督学习算法之一19事实上，许多以前的研究已经证明，SVM在文本分类工作中非常有效且更鲁棒（Go et al.，2009; Pang等人，2002; Tang等人，2014; Zhang等人， 2015年）。由于SVM是一种监督学习算法，我们手动标记了10，000条评论作为训练样本。其他评论使用训练好的模型进行预测在获得情感标签后，计算每个产品的评论变量的公式如下：并计算输入单词和其他单词使用余弦相似度的单词。余弦值越高，这两个词在语义上越接近。计算是通过word2vec中称为距离的命令来完成的一些深度学习方法，如CNN，RNN，也被用于情感分类。参见例如 Glorot等人（2011），Tang et al. （2015）和Leeet al. 2017年，仅举几例。X.谭，Y。萧数据科学与管理2（2021）16IJIJJT-jt01二-3-JT1J3-JT2-JT图二. 查看选定智能手机的变量。Xij¼伊杰角POS（一）生产商、开发商、零售商和消费者用来确定Nij穆恩·伊杰其中，Xij表示产品j的评论变量i，Npos是产品特征i的正面评论数量，Nneg是产品特征i的负面评论数量也就是说，审查变量是定义为正面评价与正面评价之和的比率负面评价。表5提供了117种产品的审查变量的详细汇总统计它表明设计、操作性能和质量倾向于彼此同质化另一方面，智能手机在电池寿命、信号、内存、音调和摄像头方面高度异质。为了更直观，我们比较了五种产品，如图所示。二、图中显示，三星Galaxy Note 5拥有最好的屏幕，但电池寿命最差Vivo X9在相机，电池方面领先这些属性为交易价格增加了重要价值结果获得的信息可以为未来的决策提供重要信息。20根据以前的文献，我们使用特征定价方法，研究通过审查变量测量的不可观察属性对交易价格的影响。我们假设，消费者一方面，智能手机的价格受到产品本身属性的影响屏幕尺寸、RAM、ROM及其相机）、其竞争者的属性以及市场环境（例如，品牌的数量，以及同一价格段中竞争产品的数量另一方面，消费者的负面评价会给生产商带来降价压力。因此，我们还将评论中的信息纳入特征定价模型。该模型编写如下：和色调，这支持了其需求的快速增长最后但并非最不重要psW.zzzsTC.美国φΣμiPhone 7的性价比情绪得分落后，因为其高昂的价格。结果表明，审查变量确实可以jtj;-jt;-jt;t;j;-jt;-jt;S拉维特S（二）¼ϕþϕzjþϕzjtþϕzþφ ξþφ ξþφ ξTt4. 经验模型4.1. 特征定价模型许多研究已经将特征定价方法应用于不同的行业，例如房地产（例如，Rotimi和Chan，2017年），汽车（例如，Crawford和Peter，2019年;Matas和Raymond，2009年），酒店（例如，Chris等人，2018; Gibbs等人， 2018年），葡萄酒（例如，贾等人， 2018年;Nerlove，1995年），云计算（例如，Wu等人，2018年），和智能手机（例如，其中ps是在时间t段s中产品j的价格。W·是观察变量的函数，C·是未观察评论变量的控制函数是蜂窝电话属性的向量，包括网络类型的数量ROM和PIXel等等。它还包含两个随时间变化的变量，即直到时间t的替代品数量和产品年龄。Z-JT和ZS分别代表其替代品和属于相同段S直到T的那些替代品的累积平均产品属性。reviewj是一个审查变量的向量，例如电池、外观和屏幕。同样地，Mario，2018）。特征定价模型基于以下假设：任何商品都代表了一系列定义质量的特征公司简介以及-jt 是每次评论的累积平均值的向量理论基础是Rosen（1974）的开创性论文，该论文假定商品是根据其产生效用的属性来定价的。罗森假设，消费者在做出购买决定时会评估这些属性。产品的价格是由其有形和无形的特性以及外部影响因素共同决定的t结束时产品j的替代品的变量Tt捕捉定价的时间趋势是感兴趣的参数，特别是，最后，μjt是误差项。如竞争环境和替代品的特点，互补。正如Monson（2009）所声称的那样，享乐模型可以[20] Monson（2009）还详细介绍了享乐定价法。N抓住产品差异化的来源。JTX.谭，Y。萧数据科学与管理2（2021）17它它JJexpVikt它它JJ4.2. 一个静态离散选择模型如果评论变量对交易价格具有预测能力，那么我们有兴趣在离散选择模型中探索评论变量对解决内消问题，特别是价格在本研究中，我们发展了一个条件罗吉特离散选择模型来检验评估对评论变量的敏感性在静态模型的估计中，有117个可用的手机模型消费者i使用手机j2Jt的效用，其中Jt是在时间t的选择集，由下式给出：uijt<$Uijtεijt<$Azj-α0pjtβxijtεijt（3）表6价格对审查变量的初步回归因变量：价格（一）（二）（三）星级评定5.249***（0.010）5.267*（0.009）2.829*（0.005）摄像头0.674* 0.636*0.683*（0.003）（0.003）（0.002）内存-0.057*-0.035* 0.198*（0.002）（0.002）（0.001）质量-7.489*-7.320*-2.685 *（0.015）（0.015）（0.007）εijt 联系我们IJT（四）电池-1.062*-1.031*-0.440 *（0.001）（0.001）（0.001）信号-0.690*-0.680*-0.287*其中xijt是属性虚拟项和消费者特定特征之间的交互项的向量。21消费者特征包括性别、年龄、一个时期的滞后数据流、一个时期的滞后支付和品牌忠诚度虚拟。zj、pjt和pjt已在等式（2）中定义。误差项εijt包括未观察到的检查变量和遵循i.i.dGumbel分布的随机冲击载荷由于我们假设价格与不可观测的属性相关pjt对εijt的依赖性将导致使用模型（3）对价格的不一致估计系数。我们期望在模型中引入评审变量后，偏倚会减少结合等式（3）和（4），效用函数变为（0.003）（0.003）（0.001）屏幕质量1.535* 1.620*0.239*（0.004）（0.004）（0.003）性价比-3.129*-3.102*-1.370*（0.011）（0.011）（0.006）色调0.633* 0.609*-0.069 *（0.002）（0.002）（0.001）操作系统-0.960*-1.087*-3.029 *（0.014）（0.013）（0.009）运行速度2.886* 2.986*4.216*（0.013）（0.012）（0.009）手感7.258* 6.989*1.088*（0.019）（0.019）（0.010）加热-0.721*-0.697*-0.266*uv/V开关1/4αz-αpαβxþρξþυ（五）（0.002）（0.002）（0.001）IJTIJTIJTj0jtIJT吉吉特外观0.075*-0.195* 0.878*条件logit模型将消费者i在时间t选择产品的概率指定为（0.024）（0.023）（0.014）分辨率0.391* 0.389*0.226*（0.003）（0.002）（0.001）备份-3.216*-3.207*-2.440*P.y/j。x; z; x; z; x;zVijtk2Jt（六）（0.006）（0.006）（0.004）模型可用极大似然估计法进行估计似然函数由下式给出：常数-18.910*** 260.5***160.1***（0.048）（3.804）（2.845）L-2000-YYYP. y/j。x;z;电子邮件地址（7）我J不每次评论的累积平均值否是是包括竞争产品的变量每次审查否否是其中，θ1 =α0;α;β;ρ0是待估计参数的向量，如果选择j，则dijt为1，否则为0225. 估计结果在分析特征定价回归结果之前，我们首先检查评论变量对价格的预测能力评价变量与价格之间的关系将在特征定价回归中进行分析。表6报告了三种情况下价格对审查变量的OLS回归当我们只包括表6第（1）列中列出的产品自身的评审变量时，R2为0.57。在添加替代品的每个评论变量的累积平均值后，可信度增加到0.59，意味着这些变量中列（3）显示，它包含了更多有用的信息，在相同价格段替代品的每个审查变量的累积平均值，这两个变量加在一起可以解释82.5%的价格方差。初步回归表明，耐用品的在线评论为学术研究人员提供了一个有效的渠道来寻找合适的价格工具。享乐定价回归的估计结果见表7。列（1）（（2））显示排除（包括）[21]当模型中包含交互作用项时，详见Hoffman and Duncan（1988）。22我们在Stata中使用clogit命令来运行模型。Clogit为面板数据拟合固定效应Logit模型。包括同一细分市场竞争产品的变量意见132113211321r平方0.5700.5920.825注：括号中为稳健标准误***p 0.01，**p 0.05，*p 0.1。回归中未观察到的审查变量的控制功能调整后的R2值表明，模型可以解释90.4%和93.8%的智能手机价格方差在工业实践中，3.4%被认为是预测精度的一个很大的提高。由于产品属性与相关的审查变量相关，当我们将控制函数降至误差项时，系数会有偏差。当我们将评审变量纳入模型时，如表7的第（2）列所示，某些变量的幅度和符号都发生了很大变化。例如，第（1）栏中的时间趋势是积极的，这与我们从五年市场竞争中得出的直觉相反引入复习变量后得到了正确的时间因此，我们只在第（2）栏中重点分析了属性和评审变量的重要性。正如预期的那样，竞争对手的数量增加了竞争，并导致了价格下降的压力。此外，保持其他变量不变，手机与八核心CPU是平均128 CNY便宜比那些较少的核心。与行业惯例一致，产品年龄及其平方项的系数显示价格将于11. 8个月后下跌这是供应商向市场推出新产品的通常时间间隔。另一方面，屏幕尺寸，RAM，ROM，双SIM卡，高速CPU，像素和分辨率都在决定交易价格方面发挥着重要的积极作用。这主要是由于提高这些属性的成本很高屏幕尺寸-2.675*-2.788*-0.704 *（0.006）（0.005）（0.003）X.谭，Y。萧数据科学与管理2（2021）18表7特征定价模型的估计结果因变量：价格没有评论（1A）评论（2a）无评论的变量（1b）评论（2b）号竞争对手-0.004***（0.0001）-0.002*（0.0002）品牌-vivo 0.437*（0.001）-0.048*（0.002）屏幕尺寸0.393*（0.0006）0.535*（0.0009）品牌-小米-0.229*（0.001）0.133*（0.002）RAM 0.234*（0.0004）0.144*（0.0004）品牌-酷派0.657*（0.002）0.590*（0.002）ROM 0.006*（1.1e-05）0.006*（1.0e-05）常数10.823*（0.106）25.086*（1.701）两个SIM卡虚拟0.586*（0.001）0.388*查看变量（0.0001）CPU GHz 0.491*（0.0008）八核CPU-0.098*（0.0004）0.508*（0.0008）-0.128*（0.0004）星级照相机PiXel0.100*（0.0009）0.197*（0.0009）运行速度分辨率0.319*（0.0007）网型数量0.013*（0.0002）产品年龄0.027*（0.0001）产品年龄平方-0.001***（2.4e-06）0.185*（0.0004）-0.007*（0.0002）0.031*（0.0001）-

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

在线评论对离散选择模型内隐问题的影响

离散的HMM模型，语音训练用途

离散模型在实际问题中有哪些应用分别举例

常见的离散模型常用的处理方法

数学建模中的离散模型有哪些

（1）常见的离散模型有哪些类型？其常用的处理方法有哪些？（2）对上述类型在实际问题中有哪些应用分别举例？（3）自己尝试建立一个离散模型，并求解。

常见的离散模型有哪些类型？

常见的离散模型有哪些类型？其常用的处理方法有哪些？（2）对上述类型在实际问题中有哪些应用分别举例？

马尔可夫模型、隐马尔可夫模型、层次化隐马尔可夫模型、马尔可夫网络

隐马尔可夫模型与卡尔曼滤波区别

隐马尔科夫模型（HMM）

描述隐马尔可夫过程，隐马尔可夫模型

生成隐函数时间序列模型

隐马尔可夫模型概率计算问题具体应用

隐马尔科夫和马尔科夫区别

隐马尔可夫模型求解地图匹配

隐马尔可夫模型python

什么叫马尔可夫链？什么叫隐过程？什么叫隐马尔可夫过程？为什么说语音信号可以看成隐马尔可夫过程？隐马尔可夫模型有哪些模型参数？请叙述这些参数的含义和定义式。

机器学习中用来预测的模型有哪些

价格波动监测模型都有哪些，请列出10个

最新资源