地理空间信息
GEOSPATIAL INFORMATION
2021 年 1 月
第19卷第1期
Jan. , 2021
Vol.19, No.1
Python和FME 下的疫情数据可视化
谭仁春
1
,江 威
1*
,马艺文
2
,陈俊伟
3
(1. 武汉市测绘研究院,湖北 武汉 430022;2. 武汉市自然资源和规划信息中心,湖北 武汉 430014;
3. 湖北金拓维信息技术有限公司,湖北 武汉 430223)
摘 要:信息化和大数据时代提供了海量的数据源,而 FME 平台和自然开发语言 Python 给数据挖掘增添了无限可能,使数据真正
地为我所用。针对 COVID-19 数据,设计了从数据爬取到数据可视化,再到轻量级 Web 应用发布和集成展示的一整套算法与流程。
关键词:疫情数据可视化;新冠肺炎;Python;FME
中图分类号:P208 文献标志码:B 文章编号:1672
-
4623(2021)01
-
0001
-
03
时间和空间是现实世界最基本最重要的属性,有
研究表明,现实世界中的数据超过 80% 与地理位置有
关
[
1
]
。地理信息系统(GIS)技术的出现和发展,为传
染病的研究工作提供了强有力的工具和独特的研究方
法
[
2
]
。3S 技术的发展与应用,成为从时间和空间上跟
踪、监测传染病蔓延、传播的重要手段,尤其是涉及
大范围、多因素的动态研究,多源多时相多尺度的空
间数据更能体现出其独特优势
[
3
]
。3S 技术和时空大数
据等信息化技术的高速发展和应用,为传统的各类公
共卫生信息和数据提供了丰富的分析方式和手段,改
变了数据分析理论滞后和分析技术缺失的现状,可以
充分挖掘数据的隐含知识和潜在应用价值。
传染病的防治和应对是健康城市建设的重要方
面
[
4
]
。在人口流动不断加快加大、全球重大传染病疫
情频发的时代,传染病预防控制工作已成为我国可持
续发展工作的重要组成部分
[
5
]
。新型冠状病毒肺炎是
近百年来人类遭遇的影响范围最广的全球性大流行病,
对全世界是一次严重危机和严峻考验,人类生命安全
和健康面临重大威胁
[
6
]
。应从数据分析的角度,对历史
数据进行深入的结构性分析,从中挖掘出具有社会意
义和理论价值的知识,作为决策的科学依据
[
7
]
。结合
GIS 领域的中间件工具 FME 和面向对象的自然开发语
言 Python,本文设计了一套获取 COVID-19 数据并绘
制疫情地图的算法流程,实现了疫情数据获取、展示、
发布和应用的集成管理。
1 技术路线
FME 是空间数据转换处理系统,提供了完整的空
间 ETL 解决方案。ArcPy 是一个 Python 站点包,通
过 Python 实现地理数据分析、数据转换、数据管理
和地图自动化。Anaconda 是一个用于科学计算的开
源 Python 发行版本,提供跨平台的包管理和环境管理
功能,可以很方便地解决多版本 Python 并存、切换以
及各种第三方包安装问题。在跨平台整合方面,FME
Workbench 中可实现 fmepython、ArcPy 和 Anaconda 的
集成,只需在模板调试时配置 Python 编译器分别指向
Anaconda 和 ArcPy 即可。由于 fmepython 尚未封装为
独立包,脱离 FME Workbench 开发平台和环境后,无
法调用 fmepython 和 FME Workbench 中的转换器。目
前通过 PyCharm 等 IDE 支持 ArcPy 和 Anaconda 的集
成,不能调用 fmepython。
结合现有的平台软件和专业化工具,本文设计了
时空疫情大数据可视化技术路线,最终形成发布为
Web 应用的疫情时序变化地图。技术路线包括数据抓
取、数据清洗、数据可视化和疫情地图发布 4 个关键
步骤,如图 1 所示。
FME Desktop
ߍ㏴〛
䬠Т
ദ䃪
FME Server
Anaconda
ArcGIS API for
Python
FME Objects
API for Python
ArcGIS Server
图 1 技术路线图
2 疫情数据抓取与清洗
2.1 数据抓取
基于 Python 和 FME,本文设计了疫情聚合数据
doi:10.3969/j.issn.1672
-
4623.2021.01.001
收稿日期:2020
-
06
-
08。
项目来源:中国博士后科学基金面上资助项目(2020M682505)。