Python实现2019-nCoV疫情数据拟合与预测分析

52 浏览量更新于2023-03-03 5 收藏 86KB PDF 举报

本文主要介绍了如何使用Python对2019-nCoV疫情的确诊数据进行数据拟合和预测。作者遵循三个步骤：绘制散点图以了解数据分布、拟合数据并预测未来趋势。首先，为了理解数据的分布规律，我们需要创建一个散点图。在Python中，我们可以使用matplotlib库来实现这一目标。通过`plt.figure(figsize=(16,8))`创建一个图表，并使用`add_subplot`添加子图。然后，`scatter`函数用于绘制散点，`set_xlabel`和`set_ylabel`设置坐标轴标签，`set_title`设定图表标题。自定义横坐标标签可以更好地展示时间序列。第二步，数据拟合是关键。这里选择使用logistic函数，因为它能很好地描述疫情初期到饱和状态的增长趋势。logistic函数的一般形式是： \[ f(t) = \frac{K}{1 + P_0 e^{-rt}} \] 其中： - \( K \) 是环境容量，表示疫情最终可能达到的最大确诊人数。 - \( P_0 \) 是初始容量，即疫情开始时的病例数。 - \( r \) 是增长速率，决定了疫情增长的速度。为了找到最佳拟合参数 \( K \), \( P_0 \), 和 \( r \)，我们可以使用`scipy.optimize.curve_fit`函数。这个函数会找到最优化的参数值，使得拟合曲线尽可能接近实际数据。一旦我们得到了拟合参数，就可以使用`logistic`函数绘制拟合曲线，与原始数据一起显示在散点图上，以便比较和分析。第三步，利用拟合的logistic函数，可以预测未来的疫情发展趋势。通过将未来的日期（或天数）作为输入，计算对应的病例数，从而得到预测结果。总结，这个过程展示了如何利用Python的数据分析工具，如matplotlib和scipy，对疫情数据进行可视化和数学建模，从而预测疫情的发展。这种分析方法对于公共卫生决策者理解和控制疫情具有重要意义，同时也为其他类似事件的数据分析提供了参考框架。

运用运用python实现实现2019-nCoV疫情确诊数据拟合与预测疫情确诊数据拟合与预测

思路思路

第一步，画出现有数据的散点图，大致了解其分布规律

第二步，利用现有数据拟合出曲线，求解拟合曲线的参数

第三步，利用拟合曲线对未来预测

下面严格按照这散布走模式进行

第一步第一步散点图散点图

按照时间序列将确诊病人数在坐标轴上描出散点，同时添加坐标的标签，顺便更改横坐标的刻度标签，使得其看起来像随时间变化而变

化的。

#散点图

fig=plt.figure(figsize=(16,8)) #建立画布

ax=fig.add_subplot(1, 1, 1)

ax.scatter(t,confirm, color="k", label="确诊人数") #真实数据散点图

ax.set_xlabel("天数") #横坐标

ax.set_ylabel("确诊人数") #纵坐标

ax.set_title("确诊人数随时间变化情况") #标题

#ax.set_xticklabels(['', '1月13号', '1月18号','1月23号','1月28号', '2月2号', '2月7号','2月13号','2月20号'], rotation=30, fontsize=12) #自定

义横坐标标签

ax.set_xticklabels(['','1月13号', '1月23号', '2月2号', '2月10号','2月20号','3月1号','3月10号'], rotation=30, fontsize=10) #自定义横坐标标

签

第二步第二步拟合拟合

一般的拟合有两种方法，第一种用多项式拟合，因为多项式是最简单的函数结构，且任何一个连续函数都可以转化为多项式；第二种是

用确定的函数拟合，需要先定义出函数表达式，这里采用logistic函数，因为从散点图可以看到这些散点大致分布在“S”形曲线的前半部

分上，logistic函数表达式如下

其中

K为环境容量，即增长到最后，f(t)能达到的极限

P0为初始容量，就是t=0时刻的数量。

r为增长速率，r越大则增长越快，越快逼近K值，r越小增长越慢，越慢逼近K值。

首先定义出logistic函数，其中K,P0,r是待求的参数，然后调用from scipy.optimize里面的curve_fit函数进行拟合，会得到拟合参数，接

着把拟合曲线也绘制出来

def logistic(t,K,P0,r): #定义logistic函数

exp_value=np.exp(r*(t))

return (K*exp_value*41)/(K+(exp_value-1)*41)

coef, pcov = curve_fit(logistic, t, confirm) #拟合

print(coef) #logistic函数参数

y_values = logistic(t,coef[0],coef[1],coef[2]) #拟合y值

plt.plot(t,y_values,color="blue",label="拟合曲线") #画出拟合曲线

第三步第三步预测预测

有了拟合曲线的参数就能够得到疫情变化函数表达式

其中ttt是自变量，单位是天数，fff因变量，表示是确诊人数，单位是人，该表达式表示随着天数的增加确诊人数的变化情况，大约2月

11号左右出现平稳点，疫情得到有效控制。

最终图最终图

预测数据

category=OptimizeWarning)

[7.49955152e+04 1.00000000e+00 2.93414741e-01]

下载后可阅读完整内容，剩余2页未读，立即下载

weixin_38679651

粉丝: 6
资源: 934

Python实现2019-nCoV疫情数据拟合与预测分析

基于python的疫情分析.zip

python做数据拟合

基于SIR模型的河南疫情模型源码

python获取2019-nCoV疫情实时追踪数据

基于python获取2019-nCoV疫情实时追踪数据.rar

2019-nCoV-News：2019-nCoV疫情实时播报

基于springboot-2019-ncov疫情态势信息管理系统

2019-nCov疫情实时趋势数据可视化Echarts学习(4):JSON数据数组排序和各省份数据柱图

基于MATLAB对2019-nCoV疫情干预措施影响的研究.rar

基于MATLAB对2019-nCoV疫情干预措施影响的研究.pdf

最新资源