数据科学与经济学硕士论文:意大利COVID-19预测仪表板

需积分: 10 0 下载量 111 浏览量 更新于2024-12-25 收藏 22.45MB ZIP 举报
资源摘要信息:"本文档是一个硕士学位论文项目的资源集合,该论文由米兰大学圣迭戈分校授予数据科学与经济学硕士学位。项目的主题是开发一个在意大利地区和省级进行COVID-19预测的仪表板。该论文的完整分析包含在notebooks文件夹中,其中涵盖了模型的构建、绘图等详细操作。源代码可以在src文件夹以及app.py脚本中找到。用户可以通过两种方式来查看和使用该仪表板:一种是通过点击“在Streamlit中打开”的徽章来预览;另一种是通过克隆GitHub仓库,并按照指定的命令在本地运行开发版本的仪表板。" 从标题和描述中提取的知识点包括: 1. 数据科学与经济学硕士学位:论文的授予机构是米兰大学圣迭戈分校,显示了该机构在跨学科领域的教育和研究能力。 2. COVID-19预测仪表板:该硕士论文项目的主要成果是一个针对意大利地区和省级的COVID-19疫情预测仪表板,这表明了数据分析在公共卫生领域的重要应用。 3. Jupyter Notebook的使用:notebooks文件夹中包含的分析过程显示了Jupyter Notebook在数据科学项目中的广泛应用,特别是在原型开发和数据可视化方面。 4. 源代码文件结构:src文件夹和app.py脚本的提及表明了代码库的组织结构,其中src可能包含应用程序的库代码,而app.py则可能是程序的入口文件。 5. Streamlit的应用:论文中提供了在Streamlit中运行和预览仪表板的指导,Streamlit是一个用于快速创建数据应用的Python库,说明了作者在构建和展示数据产品方面的实践能力。 6. 计算机操作指导:文档中提供了详细的命令行操作步骤,用以克隆GitHub仓库和运行仪表板开发版本,这反映了硕士项目对于学术界和行业界实用性的重视。 7. 依赖项管理:通过pip安装requirements.txt文件中的依赖项,说明了在数据科学项目中管理外部库和工具的标准做法。 8. 数据分析技术:在标签中提及了"tensorflow", "lstm", "arima", "compartmental-models" 和 "sird-model"等关键词,指出了项目中可能使用了深度学习(尤其是LSTM循环神经网络用于时间序列分析)、ARIMA模型(自回归积分滑动平均模型,用于时间序列预测)和隔室模型(一种用于模拟传染病传播的数学模型)等方法。 9. 流行病学背景知识:标签中提到的“covid-19”, “covid”, 和“sird”等,指明了项目具有流行病学背景,特别是关注COVID-19疫情的分析和预测。 10. 跨学科研究:标签中包含了"thesis", "master-thesis", 和 "JupyterNotebook"等关键词,强调了本项目是硕士学位论文研究的一部分,且在研究过程中使用了跨学科的研究工具和方法。 综上所述,这个硕士学位论文项目涉及了多个领域的知识和技术,包括数据科学、机器学习、流行病学、软件工程和互联网技术等,且将这些知识综合应用于解决当前全球面临的重要公共卫生问题。