深度学习与商业分析：现实挑战与未来路线

196 浏览量更新于2024-01-02 收藏 884KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

International Journal of Information Management Data Insights 3（2023）100146商业分析中的深度学习：期望与现实的冲突Marc Schmitta，ba英国牛津大学计算机科学系b英国斯特拉斯克莱德大学计算机与信息科学系aRT i cL e i nf o保留字：深度学习机器学习商业分析人工智能数据驱动型决策数字化转型数字化战略a b sTR a cT由全球竞争塑造的快节奏数字经济需要基于人工智能（AI）和机器学习（ML）的数据驱动决策。深度学习（DL）的好处是多方面的，但它也有局限性，到目前为止，这些局限性本文解释了为什么DL -尽管它很受欢迎-在业务分析中加速其采用的困难。它研究表明，深度学习的采用不仅受到计算复杂性、缺乏大数据架构、缺乏透明度（黑盒）、技能短缺和领导承诺的影响，而且还受到DL在具有固定长度特征向量的结构化数据集的情况下并没有优于传统ML模型的事实的影响。深度学习应该被视为对现有机器学习模型的有力补充，而不是一种“一刀切”的解决办法。结果强烈表明，梯度提升可以被视为首选模型用于在业务分析中对结构化数据集进行预测。除了基于三个行业用例的实证研究之外，本文还对这些结果进行了全面的讨论，实际意义以及未来研究的路线图。1. 介绍过去的十年是由数据存储和分析能力的巨大改进所塑造的（Baesens，Bapna，Marsden，Vanthienen，&Zhao，2016;Henke等人，2016年）。始于大数据（Kushwaha，Kar，&Dwivedi，2021）的革命为我们带来了一个数字化不断变化的时代，加速全球化，以及不断向数字世界经济迈进（Davenport，2018;Warner& Wäger，2019）。在当今世界运营的公司&&&&必须在超快速的市场中应对全球竞争（达文波特，2018），人工智能支持的信息管理（博尔赫斯，劳林多，Spínola，Gonçalves，Mattos，2021 ;柯林斯，Dennehy ， Conboy ， Mikalef ， 2021 ; Duan ， Edwards ，Dwivedi，2019 ; Verma，Sharma，Deb，Maitra，2021）是驾驭21世纪数字风暴的关键。人工智能（AI）和机器学习（ML）已经成为被广泛接受为决策的通用技术（Agrawal，Gans，&Goldfarb，2019），跨越各种领域，行业和功能，包括生物技术，医疗保健（Sounderajah等人， 2022;Young&Steele ， 2022 ）、市场营销（ Verma 等人， 2021年）、人力资源管理（Votto、Valecha、Naja firad、&Rao，2021年）、金融服务（Schmitt，2020年;Singh、Chen、Singhania、Nanavati、&Gupta，2022年）、保险（Rawat、Rawat、Kumar、&Sabitha，2021年）、风险管理（ Fujii 、 Sakaji 、 Masuyama 、 &Sasaki ， 2022 年 ;Schmitt，2022年b）、网络安全（Taddeo、McCutcheon、&Floridi，2019 年 ;Thorat 、 Parekh 、 &Mangrulkar ， 2021 年）以及许多其他（Kumar、Kar、&Ilavarasan，2021年）。数据分析和信息系统（Kushwaha等人，2021）为可操作的见解奠定了基础，是所有领域基于AI的决策的主要推动因素。负责将原始数据转换为有价值的业务见解的功能称为业务分析。这是一个跨学科的领域，它结合了机器学习，统计学，信息系统，运筹学和管理科学的专业知识（Sharda，Delen，Turban，2017）。商业分析构成了一个相当长的不同分析链，包括描述性、预测性和规范性分析（Delen Ram，2018）。ML主要在商业智能的预测领域运作，但也开始纳入规范性分析（Bertsimas Kallus，2019）。负责推动当前数字革命的主要技术之一（Agrawal等人，2019;Bughin等人，深度学习（LeCun，Bengio，&Hinton，2015）。它是ML的一个子集，是从早期对大脑启发的神经网络的研究中产生的。DL能够学习复杂的数据分层表示。它能够超越传统方法，并在不同领域具有接近或超过人类水平的预测能力。DL突破的主要原因来自三个不同领域的发展（Goodfellow、Bengio、Courville，2016）：(1) 优化算法允许训练深度神经网络（Hinton，Osindero，&Teh，2006）;（2）“大数据”时代&增加了大型结构化和非结构化数据集的数量，这些数据集现在已经成熟可以收获（Chen，Chiang，Storey，2012;Kushwaha等人，电子邮件地址：marcschmitt@hotmail.dehttps://doi.org/10.1016/j.jjimei.2022.100146接收日期：2022年5月14日;接收日期：2022年11月26日;接受日期：2022年12月1日2667-0968/© 2022作者。由Elsevier Ltd.发布。这是一个CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）可在ScienceDirect上获得目录列表国际信息管理数据见解期刊主页：www.elsevier.com/locate/jjimeiM. 施密特International Journal of Information Management Data Insights 3（2023）10014622021年）;以及（3）硬件改进，特别是GPU的改进，使得有可能用这些巨大的数据集来训练那些高度耗电的模型。非结构化高维数据集的准确性能只有在深度学习的进步下才有可能实现，深度学习显著增强了机器学习领域（Jordan Mitchell，2015），以解决更多用例并接管最初仅保留的任务对于人类（Agrawal等人， 2019年）。然而，当涉及到在业务分析和信息管理中采用深度学习时，似乎存在一定的困惑。因此，本文试图澄清为什么DL可能用于或不用于某些业务用例，以及原因是什么，并给出了在实践中应用DL的建议。企业价值链中的大多数分析部门传统上一直在使用预测统计和机器学习模型，如GLM、CART和集成学习。这些模型是帮助完成直接影响公司和组织底线的几项分析任务的重要工具（2019年）。此外，我们已经从人工智能的基本进展转向深度学习在各种科学，企业和政府中的应用（Lee，2018;Stadelmann等人，2018年）。尽管深度学习取得了巨大的成功，但对当前文献的进一步调查表明，深度学习在用于分析目的的业务功能中的采用率相当低。Chui等人（2018）分析了100个用例，以展示与传统分析模型相比，跨行业和业务功能的AI/DL相关模型的当前部署。结果是，虽然DL的采用开始增加，但似乎大多数单位仍在使用多年前已经成功的较旧的更成熟的分析模型。麦肯锡（Chui等人，2018）还区分了传统上一直使用分析的部门与外国部门定量决策支持工具。麦肯锡描绘了一幅清晰的图景，表明到目前为止，深度学习被利用的唯一领域是传统的分析部门，这些部门拥有与现代人工智能合作的自然能力和技能，而技术国外部门不愿意采用深度学习模型。但即使是在传统上与分析有着密切联系的– DL的利用率仍然相对较低，仍然是解决方案。深度学习正在成为行业标准，并被广泛认为是决策的通用技术，然而，业务分析在采用这项技术方面仍处于起步阶段。由于当前的宣传和工作描述， DL 在业务分析职能中并不占主导地位（ Kraus ，Feuerriegel，Oztekin，2019）。开发和部署DL（特别是中小型企业）不容易的主要问题可以部分地映射到DL近年来取得突破的三个原因。在业务分析功能中采用深度学习时，可以发现以下瓶颈：(1) 计算复杂性：在大型数据集上训练和验证DL模型所需的硬件是巨大的，这使得基础设施投资非常昂贵。这与这些模型的开发和实施是否会实现并反映在未来的价值增长中的问题形成了很大的对比（Bughin等人， 2017年）。(2) 基础设施：公司需要能够收集非结构化数据的连续流，以获取数据挖掘的价值，如果没有必要的“大数据”基础设施，2017年）。(3) 透明度：另一个原因是DL本身的性质。DL主要是一个黑色的盒子，这意味着它可以正确地预测，但我们缺乏对它为什么会做出某个决定的因果解释（Samek& Müller，2019）。这给受监管的行业带来了问题。(4) 技能短缺：需要人才（Kar，Kar，&Gupta，2021）来实现这些模型以及主题专业知识来定义用例（Henke等人，2016年）。目前ML专家的供需缺口使得中小型企业难以利用先进的AI。(5) 领导力承诺：全面的管理支持，以建立和推动公司范围的人工智能战略，也是提高采用速度的重要先决条件（Kar等人， 2021年）。许多关于在商业分析中采用深度学习的研究似乎忽略了它的一般价值贡献，这应该以提高预测准确性的形式出现。DL必须为自己做一个商业案例以证明其通过的合理性，但这并不总是给出。此外，复杂性和基础设施的合理性不能是全貌，因为资源不断增加，强大的处理器和数据库确实存在，一旦模型被训练，资源需求就不再那么重要了。DL在某些领域可能缺乏的另一个原因可能是它超越现有AI/ML模型的能力。几项独立的研究比较了深度学习与传统机器学习方法在结构化数据集上的预测能力，得出的结论是，深度学习的性能并不优于基于树的集成（Addo，Guegan，&Hassani，2018;Hamori，Kawai，Kume，Mu-rakami，&Watanabe，2018）。这与Kraus等人（2019）指出的DL优化器全面提高性能的说法形成鲜明对比，也与DL需要在每个业务功能中采用的一般假设形成鲜明对比（Chui等人，2018年）。虽然深度学习在图像识别和NLP等非结构化数据问题上的成功是毋庸置疑的，但在公司的业务分析功能中，深度学习在结构化数据方面的现实情况还不太清楚，这也是本文的重点。具有固定长度特征向量的结构化数据广泛存在于关系数据库和标准业务用例中。本文探讨了以下两个研究问题：• RQ 1：在具有固定长度特征向量的结构化数据的情况下，DL在监督学习问题上是否优于传统ML模型？• RQ 2：深度学习--尽管很受欢迎--是否始终是业务分析和信息管理中正确的AI/ML模型？本文的核心贡献是从结构化数据集的性能方面，清晰地描绘了深度学习在业务分析和信息管理中的应用。评论如“DL可以传统模型的简单替代”过于笼统，并不总是正确的。对于结构化数据，基于树的集合作为梯度提升似乎至少与跨不同域的DL相当。在支持这一主张，实证检验使用三个案例研究的基础上，现实世界的数据。具体而言，本文将通过以下方式对当前的文献作出贡献：(1) 基于业务分析背景下的三个真实用例，将DL与传统机器学习模型（如GLM、随机森林和梯度提升）进行比较，以验证DL在结构化数据集上的性能不优于传统方法的假设。(2) 基于实证研究结果的全面讨论，包括对研究人员和专业人员的实际影响。(3) 最后，提出了未来研究方向的路线图，以进一步将AI/ML与业务分析和信息管理相结合。本文的结构如下：第2节介绍了本研究中使用的机器学习模型-逻辑回归，随机森林，梯度提升和深度学习。二、实验设计介绍了数据集的解释、预处理步骤和软件设置。在第3节中，基于真实世界数据/业务问题的三个案例研究M. 施密特International Journal of Information Management Data Insights 3（2023）1001463（） 1张图片1 +��−��∑日本语简体中文��层次。如果神经网络有一个以上的隐藏层，给出了所有三个案例研究表明，在结构化数据（表格数据）的情况下，DL没有基于树的集成随机森林和梯度提升机的性能优势。第4节讨论了这些结果的技术含义、实践含义和未来的研究方向，而第5节则进行了总结。2. 方法和材料2.1. 机器学习本部分概述了预测分析和实验中使用的ML模型。在这个实验中使用和比较的ML模型是逻辑回归（LR），随机森林（RF），梯度提升机（GBM ）和深度学习（ DL ）。对于基础理论的全面处理，参考（Hastie，Tibshirani，&Friedman，2017）和（Murphy，2012）的ML和（Goodfellow et al.， 2016年，DL？2.1.1. Logistic回归逻辑回归（LR）属于广义线性模型（GLM）的大家族。GLM的特征在于将特征的线性组合，并在函数的帮助下将其链接到输出，其中输出具有潜在的指数概率分布，如正态分布或二项分布（Murphy，2012）。LR是二进制分类的标准方法，广泛用于学术界和工业界。输入和权重的线性组合是通过将输入值输入到逻辑或sigmoid函数中来计算和应用的，��你知道吗？��（一）这些估计。随机森林创建不同的决策树，并最终对结果进行平均，以减少预测模型的方差（Murphy，2012）。它是分类和回归任务中最有效的ML算法之一。2.1.3. 梯度提升Boosting类似于bagging，但它是按顺序构建模型，而不是平均不同的结果。Boosting的思想是从弱学习器开始，通过在每一步纠正前一个模型的错误来逐渐改进。这个过程提高了弱学习器的性能，并逐渐向更高的准确性发展。用于提升的最常见模型是决策树。有几个不同的梯度提升（GM）实现在那里。本文使用了由（Malohlava Candel，2019）实现的梯度增强版本&，该版本基于（Hastie等人，2017年）。梯度提升是目前可用的结构化数据最强的预测模型之一。2.1.4. 深度学习深度学习具有许多架构，例如前馈人工神经网络（ANN）、卷积神经网络（CNN）以及递归神经网络（RNN）。非顺序的– 在这项研究中-是一个多层前馈人工神经网络。其他更复杂的架构，如RNN，在这些情况下没有任何优势（Candel LeDell，2019）。前馈神经网络的架构图可以在图1中看到。第一列表示输入要素，称为输入层。最后一个单个神经元表示应用最终激活函数的输出。中间的两层叫做隐藏层sigmoid函数将输出范围限制在区间[0，1]内。2.1.2. 随机森林递归划分算法随机森林（RF）是集成方法的家庭和操作非常类似的决策树装袋。Bagging（Breiman，1996）从训练数据中随机选择不同的M个子集，并进行替换和平均叫做深度神经网络深度学习模型可以由几个隐藏层组成，并且使用随机梯度下降和反向传播进行训练（Goodfellow等人， 2016年）。标准的神经网络操作包括将输入特征乘以权重矩阵并应用非线性（激活函数）。输入变量=（1，2，��该线性Fig. 1. 本实验中使用的深度学习模型被称为前馈人工神经网络，因为通过网络的信号流仅向前发展。这是最合适的选择，基于结构化数据集的问题，在这项研究中使用。它包含一个输入层、一个输出层和多个隐藏层。在每个节点处，输入变量和权重的线性组合被馈送到激活函数中，以计算用于下一层。M. 施密特International Journal of Information Management Data Insights 3（2023）1001464表1数据集的描述营业面积意见描述总y= 0y= 1平衡的特征信贷风险30,00023,3646,6366636/663623预测客户是否会拖欠贷款保险理赔595,212573,51821,69421694/21694 57预测保单持有人是否会在下一年提出汽车保险索赔营销/销售45,21139,9225,2895289/528916预测目标客户是否会在直销/销售电子商务为了本研究的目的，使用随机欠采样使数据集处于平衡状态组合加上偏置项或拦截器用作激活函数的输入以计算输出Y，输出Y用作下一层的输入或表示最终输出/预测。用随机梯度下降法和反向传播法训练神经网络以激活函数的形式应用非线性对于神经网络能够学习输入数据集的复杂（非线性）表示是必不可少的。激活函数将每个节点的输出转换为非线性函数。本研究将使用以下隐藏层的激活函数构建两个不同的DL分类器：• ReLU：ReLU（ReLU）= max（0，z）∈ [0，∞），• Maxout函数：（）= max（+）∈（−∞，∞），∈��{1，��由于研究的范围是结构化数据的二进制分类，因此使用的输出激活函数是sigmoid函数��1=�� ∈ [0，1]符合二进制交叉熵损失函数。16个特征，包括二进制响应列，其指示该人是否在直接营销电子邮件之后最终在银行开设存款账户。3这个实验需要几个调整。这三个数据集都是高度不平衡的。在这项研究中，随机抽样不足，使好的以及坏的情况下进入一个平衡状态。这也可以在表1中看到。示例：如果训练一个比例为90：10的高度不平衡的数据集，那么分类器很容易通过在所有情况下简单地进行积极的观察来达到90%的准确率。为了对抗这种自然发生的对大多数阶级的引力，重新分配被用来更好地衡量预测能力。的分类器。欠采样的一个缺点可能是信息丢失，但可以忽略，因为数据集的主要目的是对引入的ML分类器进行基准测试。在模型构建之前，已经执行了预处理步骤。在预处理过程中，ML中的一个必要过程是将分类值转换为数值。1+−z+1��cal表示。特别是2.2. 实验设计2.2.1. 数据和预处理这个实验基于三个数据集。所有这三个用例都需要相同的ML方法，即监督学习和二进制分类，并在早期研究中使用，这使得早期研究的分类器强度可以轻松比较。为了促进可重复性和可比性，所选数据集都是公开的，并且可以从UCI机器学习库或公共机器学习竞赛网站“Kaggle”下载，该网站定期提供高质量数据集的访问以进行实验。本研究中使用的病例研究/数据集概述见表1信用风险第一个数据集代表来自台湾信用卡客户的付款信息。它由30，000个观察结果组成，其中23，364个是良好情况，6，636个是不良情况（标记为默认值）。每个观察包含23个特征，包括信用卡持卡人默认信息的二进制响应列。数据集中的特征主要包含历史支付信息，但也包含人口统计信息，如性别、年龄、婚姻状况和教育程度。1保险索赔。第二个数据集表示关于汽车保险投保人的信息。它包括595，212项意见，其中573，518项未归档，21，694项已归档索赔。每个对象包含57个特征，包括一个二进制响应列，表明特定的保单持有人是否提出了索赔。2市场营销和销售。第三个数据集来自零售银行，代表直接营销活动的客户信息。它包括45，211个观察结果，其中39，922个不成功，5，289个成功（导致销售）。每个观察结果包含1“https://archive.ics.uci.edu/Credit Risk”数据集可在此处访问：www.example.comml/datasets/default+of+credit+card+clients2“https://www.kaggle。com/c/porto-seguro-safe-driver-prediction/data主要包含分类字符串。在必要的情况下，分类特征被转换为因子变量，使用一种称为独热编码的方法。H2O有一个名为one_hot_explicit的参数设置，它为具有N个级别的分类特征创建N+1个新列。对于本实验研究，所有三个数据集被分成一个训练集和一个测试集，比例为80：20。为了调整模型参数，训练集将在分类器的构建过程中使用称为交叉验证的方法进一步划分为不同的训练集和验证集。交叉验证用于提高分类器对未知数据的泛化能力，并避免过度拟合。本研究使用5折交叉验证。ML中的模型调整是一个高度经验性和交互性的过程，基本上是基于试错。通常用于帮助自动化模型调优过程的方法是网格搜索和随机搜索。网格搜索在预定义的参数范围内使用不同的参数设置自动训练多个模型。总的来说，这并没有改变尝试不同参数组合的基本必要性，这些参数组合允许分类器根据底层数据集进行充分调整。本研究使用随机搜索、选择性网格搜索和手动调整来获得最终参数设置。本研究中使用的四项性能评价指标（Flach，2019）为AUC、准确度、F评分和LogLoss。2.2.2. 软件数据准备和处理在RStudio中进行管理，RStudio是统计编程语言R的集成开发环境（IDE）。R是数据科学研究以及实践中原型设计的首选语言之一。机器学习模型 H2O是用Java编写的开源机器学习平台，支持各种预测模型（LeDell Gill，2019）。这使得实验和研究变得更加容易。高抽象级别允许想法和数据成为问题的核心部分，并有助于减少获得解决方案所此外，H2O具有速度优势，3“市场营销/销售数据集可以在这里访问：https://archive.ics.uci。edu/ml/datasets/Bank+MarketingM. 施密特International Journal of Information Management Data Insights 3（2023）1001465它使我们能够从基于桌面或笔记本的环境大规模的环境。这提高了性能，使其更容易处理大型数据集。R通过REST API连接到H2O。3. 数值结果在本节中，将介绍三个不同的案例研究：信用风险、保险索赔以及营销和销售，以证明深度学习虽然被宣传为一种卓越的ML解决方案，但它在在某些情况下击败了传统的机器学习方法。在每个数据集上训练混凝土、逻辑回归、随机森林、梯度提升机和两个不同的深度学习分类器。第一个DL模型是用ReLU激活函数构建的，而第二个DL模型是用Maxout激活函数构建的。 ReLU激活函数被广泛使用，并已被证明具有优越性在精度和计算速度方面。开发Maxout激活函数是为了结合dropout 提高分类准确性（ Goodfellow ， Warde-Farley ， Mirza ，Courville ， &Bengio ， 2013; Srivastava ， Hinton ， Krizhevsky ，Sutskever，&Salakhutdi-nov，2014），因此是本实验的第二选择。在模型训练过程中调整了几个超参数，以改善通过评估指标AUC、准确度、F分数和对数损失测量的性能。3.1. 案例研究1：信贷风险信用风险业务案例的数值结果，以准确预测申请人的违约类别。深度学习的性能通过四个评估矩阵AUC，准确性，F分数和LogLoss与传统的机器学习分类器进行比较。最佳性能以粗体突出显示。表2清楚地显示，GBM具有最佳的总体性能，最高AUC、准确度和F评分分别为0.774、0.712和RF紧随其后，AUC为0.773，LogLoss与GBM相同，为0.572。在信用风险数据集的情况下，两个增强模型都比两个DL模型实现了更好的性能，AUC分别为0.760和0.762。DL +Maxout模型的AUC符合性略高于DL + ReLU，而LogLoss相反，这导致两种DL模型的性能相似按评估措施分类的每个模型的结果的图形表示可以在图中找到。 2.表现最好的模型表2案例研究1的数值结果-信用风险。方法样本外性能AUC精度F-score对数损失Logistig回归0.7120.6710.6530.623随机森林0.7730.7110.6880.572梯度增压机0.7740.7120.6910.572深度学习+ReLU0.7600.7000.6460.592深度学习+Maxout0.7620.7030.6870.599表3案例研究2的数值结果-保险索赔。方法样本外性能AUC精度F-score对数损失Logistig回归0.6290.5940.5860.667随机森林0.6360.5980.5840.667梯度增压机0.6400.6020.5880.664深度学习+ReLU0.6280.5970.5400.670深度学习+Maxout0.6330.5970.5340.669GBM通过文本字段突出显示，该字段显示每个评估指标的性能。3.2. 案例研究2：保险索赔在表3中给出了保险案例研究的数值结果。目标是准确预测保单持有人是否会在明年内提出保险索赔。深度学习的性能通过四个评估矩阵AUC，准确性，F分数和LogLoss与传统的机器学习分类器进行比较最佳性能以粗体突出显示。表3的结果与第一个案例研究相似。在性能方面，GBM是明显的赢家，其最高AUC、准确度和F分数分别为0.640、0.602和0.588，包括最低LogLoss 0.664。RF位居第二，AUC为0.773，LogLoss为0.664。在保险案例研究中，两种集成模型都比两种DL模型取得了更好的AUC为0.633的DL + Maxout模型的AUC略高于AUC为0.628的DL+ReLU模型图3显示了按评价指标分类的每个模型的结果。性能最佳的模型（梯度提升）通过文本字段突出显示。图2. 案例研究1 -信贷风险的所有4个绩效评估指标的每个分类器绩效的图示。根据这些结果，梯度增强机（GBM）实现了最高的精度M. 施密特International Journal of Information Management Data Insights 3（2023）1001466图三. 案例研究2 -保险索赔中每个分类器在所有4个绩效指标上的绩效图示。此外，在第二个案例研究中，梯度提升机（GBM）实现了最高的预测精度。表4案例研究3的数值结果-营销和销售。例如随机森林和梯度增强。GBM原来是本研究中分析的问题类型的最高效用的模型。Kraus等人（2019）对几个基线模型进行了基准测试，他们提出的嵌入式DNN模型，导致了卓越的性能，为DL。作者建议在业务分析和运营研究领域内促进DL模型的采用。虽然Kraus et al.（2019）的论文是对商业分析DL的一个很好的概述，并且非常有见地，但该分析没有将GBM作为比较中的基线模型，该模型被广泛使用，并且已知可以在结构化数据集上提供强大而强大的预测3.3. 案例研究3：市场营销和销售表4显示了营销和销售案例研究的数值结果，以准确预测基于直接营销的成功转化。深度学习的性能通过四个评估指标AUC，准确性，F分数和LogLoss与传统机器学习分类器进行比较。最佳性能以粗体突出显示。根据表4，第三个案例研究的结果与案例研究1和案例研究2略有不同。GBM与RF共享0.940的最大AUC。RF分类器的精度也略高0.879，以及更高的F分数0.888，而GBM仍然具有最低的LogLoss，这表明模型中的预测可靠性最高。与之前的结果一致，两个集成模型都比两个DL模型实现了更好的性能，这两个DL模型的AUC都为0.930。LR的表现远逊于所有分类机构。每个模型结果的图形表示，评估措施可以在图4中找到。GBM和RF在所有性能指标上都优于两个DL模型，而逻辑回归是最弱的分类器。4. 商业分析中的DL：现实检查4.1. 结果讨论为了更好地理解深度学习在商业分析中的效用，我们将其与传统的ML模型（如GLM、随机森林和梯度提升机）进行了基准测试。基于四个评估指标AUC、准确度、F评分和LogLoss。所有三个案例研究（信用风险，保险索赔，市场营销和销售）的实证结果表明，DL没有基于结构化数据的分类问题的性能优势。相反，结果强烈支持基于树的集合情况研究两在这研究使用的相同数据集作为 Kraus等人（2019），根据经验结果，GBM至少与Kraus等人（2019）提出的深度架构相当。Hamori等人（2018）和Addo等人（2018）的其他研究包括基于树的集合作为梯度提升，并得出与本研究相同的结论。由于这项研究的结果与几篇比较DL与其他ML模型性能的论文一致，因此有强有力的证据表明基于树的方法（GBM也是如此）随机森林）确实在包含结构化数据的大多数问题上优于DL模型（已经测试了不同的配置）。此外，深度学习有几个弱点，如计算复杂性，庞大的数据需求，透明度问题，并需要高技能的劳动力，这使得它往往难以开发和部署这些模型的规模。特别是计算复杂度问题的结果与所有其他方法相比，其他ML模型4.2. 文学贡献RQ 1：在具有固定长度特征向量的结构化数据的情况下，DL在监督学习问题上是否优于传统ML模型？实证结果表明，深度学习对于基于具有固定长度特征向量的结构化数据集的分类问题没有性能优势。结果强烈的fa-vor基于树的合奏，如随机森林和梯度提升。这些结果加强了早期研究的发现（Addo等人，2018;Hamori等人，2018;Schmitt，2022 b），主要集中在信用风险管理中的应用。本文将应用领域扩展到了保险、市场营销和销售用例，结果表明，GBM在结构化数据集上的出色表现并不是一个局限于单个事件的孤立现象方法样本外性能AUC精度F-score对数损失Logistig回归0.9180.8390.8450.377随机森林0.9400.8790.8880.320梯度增压机0.9400.8780.8860.299深度学习+ReLU0.9300.8610.8770.328深度学习+Maxout0.9300.8570.8650.336M. 施密特International Journal of Information Management Data Insights 3（2023）1001467见图4。案例研究3 -市场营销和销售中，每个分类器在所有4个绩效指标上的表现的图形表示。梯度提升机（GBM）再次成为赢家，但结果不如以前那么重要，随机森林（RF）实现了非常相似的性能。主要-RQ 2：深度学习--尽管很受欢迎--是否始终是业务分析和信息管理中正确的AI/ML模型？深度学习应该被视为ML模型的前体的强大补充，而不是“一刀切”的解决方案。早期的研究（Chui等人，2018;Grover，Kar，&Dwivedi，2022;Kar等人， 2021年;Samek&Müller，2019年）已经确定了人工智能采用的不同障碍，包括计算复杂性，缺少大数据基础设施，缺乏透明度，技能短缺，领导承诺和缺少战略指导。所有这些发现都有可能影响DL在不同领域的采用速度。此外，本文中的发现表明，与其他ML模型相比，DL的预测精度并不总是更高。结果强烈表明，梯度提升可以被视为大多数业务分析问题的首选模型。它速度快，不太复杂，并且为基于结构化数据的用例提供了当前可用的最佳性能。结果是明确的，但是，业务分析专家应该仔细考虑手头数据的类型，特征和数量，以最终决定正确的模型选择。这是一个重要的整体结论和一个额外的因素，影响在业务分析和信息管理中采用DL进行数据驱动的决策。4.3. 对实践的事实证明，数据驱动或基于证据的决策优于纯粹的直觉业务决策，综合分析策略已成为所有行业的企业获取价值的必要条件。与成为数字化企业相关的挑战之一是如何准确地利用数字技术，尤其是先进的分析和人工智能。目前关于人工智能和数字战略的讨论主要集中在DL的应用上，但这并不是实现数字化转型的最佳方式。这种关注导致了一个有问题的假设，即DL在业务中的采用本身可以被视为一个基准主要解释为什么DL还没有找到它的方式进入迪塞尔-企业业务功能不如预期的原因往往是计算复杂、缺乏大数据基础设施、不透明等DL（black-boX）和技能短缺。但正如本文所示，对于某些业务分析功能缺乏采用的另一个解释是，在结构化数据用例方面，DL并没有传统分析的性能优势。例如，许多使用高级分析作为风险管理的部门完全能够开发和部署DL模型，因为所需的技能是相同的。此外，在这些部门中利用DL的必要基础设施应该到位。通常描述的问题并不是唯一的原因。问题是，对于那些部门中存在的数据，DL并没有比某些基于树的集合更好的优势。此外，速度和透明度的缺点仍然存在，这使得使用DL而不是传统分析实际上是不合理的。深度学习应该被视为对当前机器学习体系的一个有价值的补充，它提供了基于其实力创建新用例的可能性，而不是强行取代同样强大并且可以在高级分析中轻松共存的模型。这一认识触发了第二个论点，它与以下内容有关：底层数据集的性质。在业务分析中所面临的问题中存在的数据类型可以在很大程度上分为三组（Chen等人， 2012年）：（1）来自关系数据库管理系统（DBMS）的结构化数据，（2）非结构化数据，主要来自基于网络的活动（社交媒体分析等），以及（3）基于传感器和移动设备的内容，在研究活动中，这些内容基本上未被触及。业务分析中的许多问题确实是基于结构化数据集的，并且考虑到大多数业务功能使用的正是这些类型的数据，因此DL仍然是一种相当稀缺的ML算法来支持他们的决策也就不足为奇了。大数据时代带来了跨多个领域的单个数据集内的大量数据，这满足了基于深度学习的经验预测的要求然而，重要的是要根据DL模型的优势来区分和使用DL模型，即使用大量非结构化数据集，这对传统分析造成了重大问题 ML总体上被认为是一种用于决策的通用技术（GPT），它刚刚开始为我们的经济注入取代传统上仅为人类保留的精神任务的能力（Agrawal等人，2019年）。它还具有创造全新商业模式的潜力（2019年）。找到符合DL优势的用例将有助于促进DL在业务分析中的采用其主要优势是在非结构化数据集上前所未有的准确性transmartML模型很早就达到了性能平台，进一步的数据对提高准确性没有帮助DL在这里有一个优势，因为它M. 施密特International Journal of Information Management Data Insights 3（2023）1001468每增加一个数据点，预测能力就会增加（Ng，2019）。这使得DL具有极强的可扩展性和未来性，特别是因为硬件能力和可用数据量将在未来几年内不断增加。此外，DL消除了对广泛的特征工程的需要，因为这通常存在于数据挖掘和预测分析任务的预处理阶段（LeCun等人，2015年）。准备数据集所需的时间通常占总任务完成时间的80%至90%，这也是深度学习的进一步发展确实会对所有分析功能产生影响的主要原因之一。在- 所有负责数字化战略和转型的管理层和从业人员都应避免将数字化视为对现有预测分析工具的简单替代或增强，而是将其视为基于数字化优势（即基于大量非结构化数据的预测）开发新的应用领域和业务分析用例的机会4.4. 未来研究以下四个关键领域可以确定，需要进一步研究以增加实用性，从而在业务分析中采用DL。(1) 未来的业务分析研究可以集中在识别当前不存在的用途，这些用途符合DL的优势。由于能够处理大量非结构化数据，未来的可能性和新的用例比传统的分析更有趣。DL拥有创造全新商业模式和价值生成方式(2) 提高深度学习对结构化数据的预测精度将是神经网络的一个改变游戏规则的发展。与传统方法相比，深度学习有几个优点，但在其当前的能力范围内，难以达到基于树的集成（如用于预测结构化数据的随机森林和GBM）的性能和准确性水平。因此，简单的替换没有意义，除非在这一领域的进一步研究实现了DL在结构化分类任务上的性能改进。诸如辍学的发展（Srivastava等人，2014）和Maxout激活函数（Goodfellow等人，2013），专门为解决分类问题而开发，正朝着这个方向发展，但如上所示，不足以达到准确度水平，以证明将基于树的集成模型替换为RF或GBM。进一步的研究可以集中在提高DL模型的能力，以适应simulation超越了传统的ML模型。这将是一个重大的这可能会导致所有其他ML模型的灭绝。(3) 另

下载后可阅读完整内容，剩余1页未读，立即下载