随机选择2014-2020年中连续3年的全国气象数据集进行需求分析,各小组完成需求分析文档一份。 2. 对数据做数据清洗操作,如果该气象站已停用,则过滤掉该站点数据,对过滤后的数据中空值进行填补(可以使用均值,众数等)。 3. mysql数据库建表,将清洗完毕的气象数据集导入mysql数据库中,按照需求文档对数据进行不同维度的数据分析(时间(小时,天,月,年),地点(气象站,城市,省),指标类型(指标列表如下: AQI PM2.5_24h PM10_24h SO2_24h NO2_24h O3_24h CO )等,将结果存入mysql数据库。用python代码写。数据样本监测点编码 监测点名称 城市 经度 纬度 对照点 1001A 万寿西宫 北京 116.366 39.8673 N 1028A 化工学校 石家庄 其中经纬度有缺失值 N
时间: 2024-02-26 18:51:55 浏览: 16
好的,您的第一个问题是关于一个数据分析项目的。以下是您的问题的解答:
该项目要求我们随机选择2014-2020年中连续3年的全国气象数据集进行需求分析,然后对数据进行清洗操作,过滤掉已停用的气象站点数据,并对过滤后的数据中的空值进行填补。接着,我们需要将清洗完毕的数据导入mysql数据库,并按照需求文档对数据进行不同维度的分析,包括时间、地点和指标类型等。最后,我们需要将结果存入mysql数据库中。这个项目要求我们使用Python代码完成。