AIS数据清洗的python代码
时间: 2023-08-24 19:09:56 浏览: 309
以下是一个简单的Python代码示例,可用于清洗AIS数据:
```python
import pandas as pd
# 读取AIS数据文件(csv格式)
ais_data = pd.read_csv('ais_data.csv')
# 去除重复行
ais_data.drop_duplicates(inplace=True)
# 去除无效数据
ais_data.dropna(inplace=True)
# 剔除错误数据
ais_data = ais_data[ais_data['latitude'] > -90]
ais_data = ais_data[ais_data['latitude'] < 90]
ais_data = ais_data[ais_data['longitude'] > -180]
ais_data = ais_data[ais_data['longitude'] < 180]
# 将时间戳转换为日期时间格式
ais_data['timestamp'] = pd.to_datetime(ais_data['timestamp'], format='%Y-%m-%d %H:%M:%S')
# 保存清洗后的数据
ais_data.to_csv('cleaned_ais_data.csv', index=False)
```
上述代码使用pandas库读取CSV格式的AIS数据文件,并执行以下数据清洗操作:
1. 去除重复行
2. 去除无效数据(缺失值)
3. 剔除错误数据(纬度和经度不在合法范围内)
4. 将时间戳转换为日期时间格式
5. 保存清洗后的数据到CSV文件中
请注意,上述代码仅提供了一个简单的示例,实际情况中可能需要根据具体数据的特点进行更多的数据清洗操作。
阅读全文