Savannah Sew-Hee的数据分析与预测模型:艺术与疫情案例研究

需积分: 9 0 下载量 113 浏览量 更新于2024-12-24 收藏 3.8MB ZIP 举报
资源摘要信息:"Savannah_Sew-Hee_Portfolio" 1. 数据可视化与仪表板设计: - Savannah_Sew-Hee在其作品集中展示了如何创建仪表板,这是一种数据可视化工具,用于提供博物馆中代表艺术家的快照。这涉及到将数据以图形化的方式展示,使用户能够直观地理解信息。 2. 时间序列分析: - 项目中使用了时间序列分析来可视化艺术品获取随时间的变化。时间序列分析是研究数据点按时间顺序排列的一系列数据点的方法,常用于经济、气象、商业活动等领域的数据分析。 3. 文本挖掘和UMAP降维: - 利用文本挖掘技术,特别是UMAP(Uniform Manifold Approximation and Projection)降维方法,Savannah_Sew-Hee识别了相似的艺术品。UMAP是一种用于数据降维的算法,常用于高维数据的可视化。 4. 二进制分类法预测员工留存: - 通过应用二进制分类方法,Savannah_Sew-Hee预测了下一个工作年度是否会保留员工。这是一种机器学习技术,用于预测属于两个类别之一的事件。 5. 特征重要性分析: - 分析了模型中的变量,以确定哪些因素在模型预测中起着最重要的作用。这一过程通常涉及统计和机器学习算法,以识别和量化输入变量对预测结果的影响。 6. Logistic回归与Random Forest模型比较: - 比较了Logistic回归模型和Random Forest模型在准确性得分方面的表现。这两种模型都是常用的机器学习模型,用于分类问题,但它们的工作原理和性能特点各不相同。 7. 地理空间分析与COVID-19违规: - 作品集还包含了使用地理空间分析来检查在纳什维尔发生COVID-19违规的时间和地点,以及分析报告的COVID违规与后续群集之间的联系。这一分析有助于理解病毒传播的地理特征。 8. 地址和业务的地理编码: - 使用Geocodio和FuzzyWuzzy工具,Savannah_Sew-Hee将坐标映射到地址和业务上,这对于地理信息系统(GIS)和位置分析非常有用。 9. 商业行为和疫情后变化: - 探索了已报告的业务类型以及疫情爆发后业务行为的变化,这有助于了解疫情对经济活动的影响。 10. 地震活动地理空间分析: - 进行了TN历史地震活动的地理空间分析,以确定应向哪些地区分配抗震救灾资金,这有助于灾害管理和资源分配。 11. 数据清洗和汇总技能: - Savannah_Sew-Hee具有处理和汇总来自多个来源(包括网络抓取)的数据的实践经验。数据清洗是数据预处理的重要步骤,用于提高数据质量和分析的准确性。 12. 计算集群作业调度: - 参与协助大型计算集群的作业调度,这涉及到计算机集群管理和优化任务分配。 13. 故障节点识别与维护: - 确定了常见故障节点以供公司检查维修情况,这是IT系统监控和维护的重要环节,有助于提高系统的稳定性和可靠性。 Savannah_Sew-Hee通过她的作品集展示了跨多个领域的IT技能,包括数据分析、机器学习、地理空间分析以及数据管理和维护能力。她的这些实践经验不仅展示了对现代IT工具和方法的熟练掌握,也体现了她在解决复杂问题和数据分析方面的深厚背景。