COVID-19病例预测的K-means-LSTM算法在美国路易斯安那州的有效性分析

185 浏览量更新于2023-12-05 收藏 1.16MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

阵列11（2021）100085基于K-means-LSTM的COVID-19确诊病例数预测ShashankReddy Vadyala a，*，Sai Nethra Betgeri a，Eric A. Sherer b、Amod Amritphale ca美国路易斯安那州拉斯顿市路易斯安那理工大学计算分析和建模系b美国路易斯安那理工大学化学工程系c美国阿拉巴马州莫比尔市南阿拉巴马大学内科，心脏病学分部。A R T I C L EI N FO关键词：冠状病毒COVID-19日级预报SEIR模型神经网络深度学习A B S T R A C TCOVID-19是一种开始在美国迅速传播的大流行性疾病，于2020年1月19日在华盛顿州发现首例病例。2020年3月9日，然后迅速增加，截至2020年4月20日，总病例数为25，739例。根据美国疾病控制和预防中心（CDC）的数据，尽管大多数冠状病毒感染者（81%）的症状很少或轻微，但其他人可能依赖呼吸机呼吸或根本不呼吸。SEIR模型在预测患有各种疾病的人群的结果方面具有广泛的适用性。然而，许多研究人员在使用这些模型时没有验证必要的假设。太多的研究人员经常通过使用太多的预测变量和小样本来创建模型，从而“过度拟合”数据。因此，开发的模型不太可能经得起对单独一组人口和区域的有效性检查。研究人员仍然没有意识到过度拟合已经发生，没有尝试这样的验证。在本文中，我们提出了一种组合算法，该算法使用Xgboost、K-Means和长短期记忆（LSTM）神经网络基于区域组合相似日期特征选择来构建预测模型（即，K-Means- LSTM），用于美国路易斯安那州的短期COVID-19病例预测。基于极端梯度提升的加权k-means算法被用来评估预测和过去几天之间的相似性。结果表明，K-Means-LSTM方法具有更高的准确性，RMSE为601.20，而SEIR模型的RMSE为3615.83。1. 介绍2019年12月，在中国武汉发现不明病毒性肺炎[1]。于二零二零年二月，世卫组织将其鉴定为冠状病毒，并根据世界卫生组织发布的COVID-19诊断和治疗指南，COVID-19通过呼吸道吸入物、飞沫、接触和粪便传播，气溶胶传播的可能性很高[2]。自首次发现以来，COVID-19迅速传播;它已被宣布为大流行病，并已感染了210多个国家的520多万人[3，4]。尽管中国在传播的最初阶段采取了措施世界各地出现了多个震中，特别是在在某些欧洲国家和美利坚合众国（美国）。美国有160万确诊病例和96，662例死亡，是世界上任何国家中最多的，截至日期_根据世界冠状病毒更新[4]。在美国，路易斯安那州截至该日期有25，739例确诊病例（第9高州）和1，540例死亡（第8高州）[5]。路易斯安那州死亡者的平均年龄为70岁，糖尿病占36.65%，心血管疾病占20.92% [6]。2020年3月23日，路易斯安那州州长实施了非常措施，通过实施“呆在家里”命令来限制传播，该命令旨在减少与感染者接触的人员。这一决定是根据每日感染率始终在1.5%至3.5%之间做出的，从2020年3月9日至5月13日的总体平均感染率为2.6%，并且入住重症监护室的患者比例始终在14%至16%之间。缩略语：COVID-19，冠状病毒病; LSTM，长短期记忆; RMSE，均方根误差; SEIR，传染病易感性EX; WHO，世界卫生组织; USA，美利坚合众国。* 通讯作者。电子邮件地址：nethraraju. gmail.com（S.R.Vadyala）。https://doi.org/10.1016/j.array.2021.100085接收于2021年6月7日;接受于2021年8月10日2021年8月21日在线提供2590-0056/© 2021作者。爱思唯尔公司出版这是一篇基于CC BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）的开放获取文章。可在ScienceDirect上获得目录列表阵列期刊主页：www.sciencedirect.com/journal/arrayS.R. Vadyala等人阵列11（2021）1000852=表1COVID-19与天气变量之间的皮尔逊相关系数天气变量Pearson相关系数最小温度0.189最高温度0.245温度平均值0.439湿度（%）0.004表2建模假设和参数设置。符号描述估计平均值数据源S易感个体–EEX构成的个人在–潜伏期I传染性个体人口密度、年龄、温度、湿度、平均家庭年收入以及COVID-19的风险，以便堂区了解这些对COVID- 19传播的影响，并做出更准确的预测。本文的结构如下：第二部分介绍了数据来源。第三节简要介绍了用于预测的流行病传播模型。第四节介绍了所提出的方法--第五节不同实验结果的比较分析。第六部分是讨论和结论。2. 方法2.1. 数据源有关COVID-19疫情的数据可从GitHub re-由约翰霍普金斯大学管理的仓库收集的建模。这是一个来自多个0.05的R值个体[18，19]来源，这是处理和交付的约翰霍普金斯大学，豁免β感染率0.040 [18，19]平均感染期3.85 [18，19]大学系统科学与工程中心（JHU CSSE）。COVID-19数据（由约翰霍普金斯大学提供）包含每日数据总人口数平均人口数教区[16个]确认死亡和康复的人。基本信息咨询-获取有关日期、国家（重新确认：国家或R0基本再生数4.83 [18，19]平均潜伏期1/5 [18，19]COVID-19的快速传播凸显了理解人口动态如何与流行病相互作用的必要性[8]。例如，病毒的影响在老年人中更为严重。人口老龄化目前在较富裕国家更为明显，这可能会减轻这种流行病在卫生系统较弱和年龄结构较年轻的低收入国家的影响。气候变量也可能是COVID-19与人类之间生物相互作用的直接原因。最佳温度、湿度和风速是决定SARS病毒存活和传播的变量[9天气变化与肺炎死亡率的变化非常显著相关[12]。伴随长期气候变化的极端天气条件也可能导致西尼罗河病毒在美国和欧洲的传播[13]。某些气候条件可以被认为是SARS等呼吸道疾病的最佳预测因素。一些统计和数学模型，如SEIR [14]（易感、暴露、感染和抗性）模型已经被设计来在许多水平上模拟疾病的影响。在SEIR模型中，疾病的传播或潜伏期被并入。SEIR模型对于估计传输的动态是有用的，但是该模型依赖于简化。这些模型通常被写为常微分方程（ODE），而不是更全面的非线性动力学模型，包括时变和概率变量到模型中。有必要确定所有用于估计的参数，如疾病传播率。数据的缺乏使得在早期阶段的模型是不可行的，以预测趋势的传播。通过在模型中包含这些特征，相对于SEIR模型，可以提高到克服 SEIR的局限性模型方法和协助为了制定公共卫生规划和政策，我们正在使用深度学习模型来实时预测路易斯安那州的新冠肺炎确诊病例和累计确诊病例。病毒的传播可能受到多种因素的影响，包括气候条件（如温度和湿度）、人口密度和种族，但很少有模型包括气候、人口密度对COVID-19的影响。在这项研究中，我们比较了K-Means- LSTM模型与更传统的房室模型（SEIR）在估计传染病爆发传播方面的性能。深度学习模型配备了个人教区人口统计数据，县）和案件的状态请注意，向公众提供的数据在这项研究中，我们关注的是路易斯安那州的每日数据，以及死亡、确诊病例和康复这三个变量数据指的是每日累积病例，涵盖2020年1月22日至2020年4月19日数据每天更新，本文中使用的文件已从[15]下载路易斯安那州的人口数据已下载[16]。收集了以下变量：教区名称，教区人口，教区人口密度，种族（白人，非洲裔美国人，亚洲人，其他人或未知），种族（西班牙裔或非西班牙裔），年龄类别，平均每日温度，平均每日湿度和教区的中位在分析中，我们只纳入了教区人口统计数据，这些数据是由约翰霍普金斯大学管理的COVID-19病例库报告的本研究所包括的气象数据均来自于研究期间的[17]。数据包括最低温度（℉），最高温度（℉），平均温度（℉），湿度（%）。2.2. 数据准备我们的分析基于以下信息：每日报道了2020年3月3日至2020年5月26日路易斯安那州教区的确诊病例数。这些路易斯安那州教区的人口统计信息。在我们研究期间这些路易斯安那州教区的温度和湿度。• 我们将所有三个数据合并为一个最终数据集。2.3. 数据分析皮尔森相关性检验用于检查天气与每日COVID-19之间的关系。表1显示，在四个天气变量中，只有平均温度（100 °F）与气候显著相关。与COVID-19相关（r0.439;p 0.001），处于中等水平。<最低温度、最高温度和湿度没有显著相关性。新冠肺炎所以我们只使用了温度平均值，天气变化作进一步分析。···S.R. Vadyala等人阵列11（2021）1000853DT表3Fig. 1. 预测COVID-19病例的整体程序。2.4. SEIR模型用于预测新的COVID-19病例的特征特征描述符号日期日期Dt教区名称P人口密度教区人口密度PdKermack和McKendrick（1927）首先提出了SEIR型流行病学模型用于传染病研究的建模。SEIR模型将人群分为四种状态：易感（S）、暴露/潜伏（E）、传染性（I）和恢复/清除（R）。分类和模型应用于基于分类的种族种族总个体数RkK有关个人的污染情况见表2。平均年龄教区的平均年龄种群规模为N，其中N= S+ E+ I+ R。在这里，我们将最低温度oF最低温度Tmin因此，所有结果都应被解释为违反相关Temperature maxo FTemperature avgo F湿度（%）教区最高气温在教区的平均气温TmaxTmax状态S= S/N，I= I/N，E= E/N，R= R/N。四个状态之间的动态由微分方程（4）家庭年收入中位数堂区家庭年收入中位数我平均随着时间的推移。式中，σ为潜伏率（一个人变得具有传染性的潜伏率）;γ为恢复率（由1/D2019冠状病毒病确诊病例2019冠状病毒病发病率预测日C其中D是感染持续时间）;COVID-19风险在教区教区发生COVID-19风险的概率Pc（A平均值，Rk）人变得易感（由于免疫力低下或其他健康相关问题），β是传染率（疾病从感染者传播到易感者的概率）。ds（t）=-βI（t）S（T）（ 1）教区H的湿度S.R. Vadyala等人阵列11（2021）1000854图二. XGBoost功能的重要性。S.R. Vadyala等人阵列11（2021）1000855-DTDTDT图三. LSTM cell diagram.dE（t）=βI（t）S（T）-β E（T）（2）dI（t）=Δ E（t）-ΔI（t）（3）dR（t）=ΔI（t）（4）在这个模型中，R0值很重要。它讲述了这种疾病的传染性。R0决定了随着时间的推移，一个感染者可以影响多少人的平均数。R0取决于COVID 19爆发的指数增长率，以及其他变量，如潜伏期（从感染开始的时间）和感染持续时间，所有这些都不能直接从结果中确定。可以使用等式（5）中所示的传输速率与恢复速率之比来计算R0。2.6. 整个手术首先，我们从年龄和种族方面估计了下文提到的路易斯安那州每个教区的COVID-19概率。然后，将聚类算法应用于特征，以找到COVID-19确诊病例和教区的时间序列数据的最佳分组。聚类后，每一组COVID-19确诊病例和教区的时间序列数据将经过一个.表4优化中使用的参数参数选择选择学习率对数均匀1 e-1至1 e-7隐藏图层离散数值1到20隐藏状态离散数值1到200激活类别{ReLu，sigmoid，tanh}批量离散数值1至10辍学日志均匀0至0.5表5（一）：路易斯安那州里奇兰确诊病例数预测。(Data点=65），表5（b）：路易斯安那州圣马丁市确诊病例数预测(Data点= 39），表5（c）：路易斯安那州卡尔卡西乌确诊病例数预测。(Data点=23）。R=β（五）0ϒ2.5. 拟议框架在本节中，我们首先介绍我们提出的深度学习架构的概述，然后讨论预测框架过程的每个组件，如图所示。1.一、日期房K-Means-LSTM西珥5/7/20209193695/8/20209594755/9/20209996795/10/2020100102835/11/2020103103865/12/2020103106915/13/2020104110935/7/20202542091295/8/20202552181365/9/20202572211495/10/20202572291525/11/20202602321635/12/20202642391755/13/20202762411925/7/20204784023265/8/20204814113315/9/20204984223415/10/20205014373575/11/20205084613695/12/20205124723755/13/2020537506381S.R. Vadyala等人阵列11（2021）1000856图四、 LSTM神经网络模型用于每日COVID-19病例预测。S.R. Vadyala等人阵列11（2021）1000857=缩放图五、路易斯安那州的COVID-19确诊病例累计数。一系列预处理步骤，如归一化，如等式（6）所示，以生成LSTM模型的输入数据。在下面的部分中，我们将简要介绍LSTM模型和使用K-means算法的时间序列聚类以及表3中使用的功能。我们结合了几天的选择。利用xgboost方法计算特征的权重，结合K-means算法确定相似日聚类。采用分离的LSTM神经网络分别预测每天和教区的COVID- 19病例重建XX-Xmin（6）X最大-X最小建议的K-Means LSTM模型的完整过程是每个LSTM模型的预测值2.6.1. 从年龄和种族估计COVID-19的概率列报如下：COVID-19病例率可按年龄或种族分类，但不适用于每种情况和种族。我们用logistic模型对模型率进行建模，以获得年龄段之间的这些估计值（例如，10-20、20-30等）和种族（白人、非裔美国人、亚裔、其他或未知）、种族··S.R. Vadyala等人阵列11（2021）1000858.）的。）的情况）（）下一页见图6。 COVID-19累计确诊病例之间的比较K-Means-LSTM COVID-19：冠状病毒病。表6图第七章显示路易斯安那州每个教区的累积数据点。特征的提取本质上是标准化的;特征EX实验结果以RMSE表示。Parish K-Means-LSTM SEIR路易斯安那州601.20 3615.83（西班牙裔或非西班牙裔）。该模型给出了每个教区的COVID-19风险概率P（Aavg，Rk），如公式（7）所示。P A平均值，R k =σδ年龄（a i）+ δ race[race ∈ r i]（7）目前的数据来源说，概率（Aavg）和Pc（Rk）是独立的[20]。为了假设相互分布，我们假设年龄组和不同种族之间存在线性（逻辑）关系：其中δageαi对每个年龄组都有一个值，δrace是标量。边际分布Pc（Aavg）和Pc（Rk）由Louisiana Facility报告[21]。我们假设这些分布在COVID-19患者中与一般人群中相同[21]。3. 特征选择为了提高学习性能和提取特征的质量，必须对数据进行预处理，并显示更多的特征以促进模型学习。在时间序列数据挖掘中，特征提取是利用降维过程来压缩大数据集的一种方法。使用特征提取，可以提高计算效率，并且可以使用更复杂的算法。的大多数方法提取通常基于应用。因此，在一个应用上工作良好的一组特征可能与另一个应用不相关。识别功能涉及数据挖掘技术的应用，如聚类算法，以从数据中获得使用模式。与其他方法相比，从时间序列中提取数据的简化特征将提供更显着的降维（特征）。本节通过使用Xgboost算法计算特征的权重并使用k-means算法的聚类来组合加权特征，从而提供了传统特征选择的替代方案。常见包中的三个集成实现，如XGBoost [22]，scikitlearn [23]和python包[24]，使用户能够使用聚类和XGBoost来计算特征重要性的度量。3.1. 权值学习算法：极端梯度提升Xgboost [25]是一种基于梯度提升树的改进决策算法，可以高效地创建提升树并并行运行。该算法的核心是优化目标函数的值。与使用特征向量来计算预测日和历史日之间的相似性不同，梯度提升构建提升树以智能地获得特征分数，从而指示每个特征对训练模型的重要性。特征的值取决于用随机噪声替换该特征时与S.R. Vadyala等人阵列11（2021）1000859+f di，djw1di1-dj12+......................+wn第二章（8）在COVID-19的情况下，我们将多个特征作为Xgboost算法的输入，以衡量函数的重要性。在Xgboost算法的训练过程中，我们可以获得每个特征对预测结果的贡献。COVID-19病例对教区的COVID-19风险敏感，用于COVID-19病例预测（见图2）。现在从它们中提取将用作后续聚类算法的先验知识的所有特征的基本值。3.2. K-means聚类是数据挖掘、压缩、概率密度估计和许多其他基本任务的最有用的工具。有许多聚类算法，如K-means，PAM，DBSCAN等等。K-means算法是最常用的聚类方法。J.Macqueen最初在1967年提出了K-Means算法[26]。使用聚类进行特征选择的步骤如下所示。• 对输入数据进行归一化处理• 选择预测日作为第一中心D0。• 选择下一个中心uj，其中uj是距离先前识别的聚类中心{0，u1，u2，.，ut-1}最远的点将重复步骤2和3，直到识别出中心K通过使用算法Xgboost计算特征的权重。之后，权重被赋予每个特征，从而为它们提供不同的重要性级别。设wp为与特征p相关联的权重标准表示为如下Y[M]分别呈现前一天的COVID-19病例和当天的特征。解码器生成输出序列{y^|M|，y^|M+1|，. y^|M+n|}这是对2019年COVID-19病例的预测，下一个n 1天。添加每个教区预测的所有单独的LSTM来获得新冠肺炎病例总数。4.1. 参数设置和培训路易斯安那州的每个城市都使用其案例数据进行训练。由于数据集相对较小，我们开发了一种更简单的网络结构来防止过度拟合。该模型使用Adam优化器进行了优化，并运行了500次迭代。虽然在优化过程中，网络是通过预测活跃病例来验证的，但同一个网络也被用于预测死亡、康复和当前病例数。2020年3月9日至2020年5月19日的COVID-19病例用于测试，其余病例用于培训。标准反向传播用于使用随机梯度下降（SGD）（一种基于梯度的技术）来训练网络。我们使用Keras [28]库和TensorFlow后端[29]来训练所提出的模型，最佳使用的参数如表4所示。5. 结果我们将K-means-LSTM预测结果与SEIR模型的结果进行了比较，如图6所示。为了准确评估SEIR模型、K-means-LSTM和LSTM的性能，计算了均方根误差（RMSE），如表5所示，并使用Python包[30]在公式（9）.）你知道的。但是，我不知道你是怎么想的。）你知道吗？̅y̅p̅r̅e̅d-̅y̅a̅c̅ t̅u̅a̅ l)̅2̅Na. 该数据点被分配到最近的集群。b. 通过重新计算质心聚类来实现聚类的更新。算法重复执行（a）和（b），直到达到收敛。我们提出的方法Xgboost-k-means可以更容易地将特征组合成一个聚类，而不是简单的算法k-means。然后，这些特征可以是用于后续加载的输入数据，以预测累积COVID病例的数量。为了预测确认的数量，从原始数据中提取特征，如数据源中所述。我们从数据中提取了12个特征。死亡，确诊病例，痊愈。教区名称，教区人口，教区人口密度，种族（汇总为白人，非洲人。美国人、亚洲人、其他和未知）、种族（西班牙裔或非西班牙裔）和中位年龄。平均温度（华氏度）。4. LSTM模型LSTM是对RNN的改进[27]。它包含一个确定信息是否有用的处理器，其中工作部分被命名为单元。一个单元格中有三扇门：输入层门、遗忘门和输出层门。输入层门和遗忘门都对细胞的状态起作用。然而，输入门的作用是选择性地将新信息记录到单元状态中，而遗忘门的目的是选择性地遗忘有关单元状态的信息。输出层门作用于隐藏层以输出信息。结构模型如图3所示。在这项研究中，目的是估计随着时间的推移，阳性COVID-19病例的数量;由于这是LSTM模型非常适合的任务，我们在研究中使用了这个模型。该架构分为两个部分：1）编码器2）解码器如图4所示。编码器旨在预测我们已经知道的COVID-19病例，但y[M-1]和确诊病例：路易斯安那州于2020年3月9日报告了首例COVID-19病例。报告了图1所示的特定日期的病例增长率。五、由于测试推出，有几个日期具有异常增长率路易斯安那州在人均测试分数方面领先于美国其他地区在近470万人的人群中研究了7.5万人.路易斯安那州每天接受约5,600次新的检测，其中6.8%的检测结果呈阳性。全国平均每天报告306例新病例[31]。针对不同教区评估K-Means-LSTM模型。拟议的K-Means- LSTM可以使用人口统计数据，人口密度，平均年龄，温度，湿度，平均家庭年收入以及教区的COVID-19风险来很好地拟合教区的病例数。一般来说，当案例计数（数据点）高于45时，模型拟合得很好，随着数据变得更丰富，拟合度会显著提高。还对2020年5月5日至5月13日的确诊COVID-19病例、K-Means-LSTM预测COVID-19病例和SEIR进行了比较。在64个教区中，基于表5（a）-5（c）中所示的数据点和表6中的RMSE中的实验结果选择了三个教区。6. 讨论预防和控制疫情蔓延需要采取有效的策略。估计疫情流行的流行病学模式对于医疗服务的分配至关重要，为了控制制造业活动，甚至为了国家的国民经济增长。因此，有必要建立一个可靠的和合适的预测模型，可以帮助政府作为参考，以决定紧急宏观经济战略和医疗资源分配。SEIR模型是最常用的流行病学模型之一。尽管基于SEIR的模型被广泛用于模拟COVID-19，·=RMSE=（九S.R. Vadyala等人阵列11（2021）1000851019日的疫情，它们确实包含一定程度的不确定性。作为SEIR模型的替代，本研究提出了深度学习模型（K-Means-LSTM），作为推进爆发建模的新趋势。K-Means-LSTM策略不能预测感染的流行和传播。相反，它预测感染病例的时间序列。K-Means- LSTM用于此分析，以预测Lousiana的COVID-19爆发。这项研究表明，K-Means-LSTM是一种有用的工具，可以根据这里报告的结果对疫情进行建模，并考虑到COVID-19疫情的复杂性及其教区之间的行为变化。训练数据用于训练算法并确定K-Means-LSTM中使用的最佳参数集。K-Means- LSTM有三个主要优点。首先，该模型不仅从历史COVID- 19数据中学习，还从COVID-19应用的人口统计数据，天气和每个教区的风险中学习。该模型的第二个优点是它能够在不同规模上应用。它目前可以预测在一个教区和国家的蔓延。最后，该模型可以预测短期和长期预测，这可能是一个可靠的决策工具。7. 限制相比之下，我们注意到K-Means-LSTM预测区间的宽度平均会随着更多数据用于预测而减少。这可以部分归因于在许多教区看到的大量病例和较长的初始预测时间。K-Means- LSTM优于常用的SEIR，但需要更多的特征和输入数据来估计趋势。虽然我们对路易斯安那州的数据有很好的结果，但这些新方法需要在其他数据集上进一步评估。然而，提出的调查结果是令人鼓舞的，将激励该小组迅速采用这些新工具8. 结论准确的COVID-19病例预测是公共卫生当局有效及时协调患者护理和解决疫情所需的其他服务的重要问题。在这项研究中，我们提出了一个K-Means-LSTM神经网络来解决传统SEIR模型中预测报告案例数量的方差和精度问题。该研究的结果将有助于政策和医疗保健部门在未来几天和几周内有效地准备和提供服务，以处理这些州的情况，包括护士，病床和重症监护设施。数据应该实时更新，以便进行更精确的比较和未来的展望。竞合利益作者声明，他们没有已知的可能影响本文所报告工作引用[1] Roosa K，et al. 2020年2月5日至2月24日中国COVID-19疫情的实时预测。传染病模型2020 网址：//doi. org/10.1016/j.idm.2020.02.002。[2] Sohrabi C，et al. 世界卫生组织宣布全球进入紧急状态：2019年新型冠状病毒（COVID-19）回顾。国际外科杂志2020。https://doi.org/10.1016/j.ijsu.2020.02.034.[3] CNN Health. 追踪冠状病毒 5 月 28 日网址：，访问时间： 2020-05-28 ，https://www.cnn.com/interactive/2020/health/coronavirus-maps-and-cases/; 2020.[4] Peirlinck，M.，例如，中国和美国的COVID-19疫情动态。Biomech ModelMechanobiol，2020年4月27日[doi：10.1007/s10237- 020- 01332-5]。[5] 新闻LDH确认1，540人因COVID-19死亡，25，739例确诊病例。5月23日; URL：.2020. 2020-05-28访问，https://www.newsbreak。com/louvet/baton-rouge/news/0OqSbR77/ldh-confirms-1540-total-death25739例确诊病例。[6] 健康，有限责任公司新冠肺炎。5月28日;网址：，访问时间：2020-05-28，http://ldh.la。gov/Coronavirus/; 2020.[7] Wikipedia. 2019冠状病毒病路易斯安那州疫情。5月28日;网址：，访问时间：2020-05- 28，https://en.wikipedia.org/wiki/COVID-19_pandemic_in_Louisiana;2020.[8] Dowd JB等人，《人口科学有助于理解COVID-19的传播和死亡率》。Proc NatlAcad Sci Unit States Am 2020. https://doi.org/10.1073/pnas.2004911117。[9] Ficetola GF，Rubolini D.气候影响COVID-19早期爆发动态的全球模式。medRX iv2020。https://doi.org/10.1101/2020.03.23.20040501网站。2020年4月20日[10] 王杰，例如，高温和高湿度减少了COVID-19的传播。可在SSRN 3551767，2020上获得。[免费全文][11] YuanJ， et al. A climatologic investigation of the SARS-CoV outbreak inBeijing，China. 美国感染控制杂志2020。https://doi.org/10.1016/j.ajic.2005.12.006网站。[12] 布尔，G.，天气和肺炎死亡。《柳叶刀》，1980年6月28日。doi：[10.1016/s0140-6736（80）92666-5]。[13] 爱泼斯坦公关。西尼罗河病毒与气候JUrban Health 2001;78（2）.网址：http：//doi.org/10.1093/jurban/78.2.367[14] Li MY，Muldowney JS.流行病学中SEIR模型的全局稳定性。1995年的生物科学数学。https：//doi.org/10.1016/0025-5564（95）92756-5.[15] 大学，J.H. 2020年系统科学与工程中心（CSSE）的COVID-19数据存储库。5月28 日 ; 网址：， [ 访问时间： 2020-05-28] ， https ： //github.com/CSSEGISandData/COVID-19.[16] 人口统计学，L。路易斯安那州的人口统计。5月28日;网址：，访问时间：2020-05-28，https://www.louisiana-demographics.com/; 2020.[17] 服务NW。国家气象局。5月28日; URL。2020. 2020-05-28访问，https://w2.weather.gov/。[18] Tam，K.- M.，N.沃克和J.莫雷诺，路易斯安那州COVID-19的预计发展。arXiv预印本arXiv：2004.02859，2020。[FREE全文]。[19] Tam，K.- M.，N.沃克和J.莫雷诺，缓解措施对COVID-19在重灾区蔓延的影响。arXiv预印本arXiv：2004.14621，2020。[免费全文][20] Caramelo F，Ferreira N，Oliveiros B. 2019冠状病毒病死亡风险因素的估计-初步结果。MedRX iv 2020。https://doi.org/10.1101/2020.02.24.20027268.[21] Li R等人，从活动出席者中感知的COVID-19感染脆弱性：美国路易斯安那州国家紧急状态宣布前两周的结果。medRX iv 2020。https://doi.org/10.1101/2020.04.01.20049742网站。[22] XP包。XGBoost Python包。URL. 2020 [访问时间：2020-05-28，https：//Xgboost.readthedocs.io/en/latest/python/# X gboost-python-package.[23] scikit学习。URL scikit-learn 2020.访问时间：2020- 05-28，https://scikit-learn.org/stable/。[24] scikit学习。聚类，URL：https：learn.org/stable/modules/clustering。html#clustering. [2020-05-28][25] 陈T，Guestrin C. Xgboost：一个可扩展的树提升系统。2016年第22届ACMSIGKDD知识发现和数据挖掘国际会议论文集。https://doi.org/10.1145/2939672.2939785网站。arXiv预印本arXiv：1603.02754vols. 2020年3月[26] Wagstaff K，et al.，Constrained k-means clustering with background knowledge.在ICML 2001中。https://doi.org/10.5555/645530.655669网站。[27] 放大图片作者：J.学习遗忘：用LSTM进行持续预测第九届人工神经网络国际会议：ICANN 1999;99：7-10。https://doi.org/10.1049/cp:19991218网站。九月[28] 网址keras.io.keras.io. 2020年。2020-05-28访问，https://keras.io/。[29] Tensorflow。URL张量2020。访问时间：2020-05-28，https://www.tensorflow.org/.[30] Sklearn。URL Sklearn。2020访问时间：2020-05-28，https：//scikitlearn.org/stable/modules/generated/sklearn.metrics.mean_squared_e rror.html。[31] URL路易斯安那州冠状病毒病例。2020. 2020年5月28日访问，https://www.theadvertiser.com/story/news/2020/05/09/louisiana-coronavirus-case-numbers-deaths-update-covid-19/3102448001/。

下载后可阅读完整内容，剩余1页未读，立即下载