使用决策树对出租车数据预测代码
时间: 2023-09-18 11:09:47 浏览: 83
新能源车辆数据概览演示案例
以下是一个使用决策树对出租车数据进行预测的Python代码示例:
```python
# 导入必要的库
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载数据集
taxi_data = pd.read_csv('taxi_data.csv')
# 数据预处理
taxi_data = taxi_data.drop(['pickup_datetime', 'key'], axis=1) # 删除不需要的列
taxi_data = taxi_data.dropna() # 删除缺失数据
taxi_data['passenger_count'] = taxi_data['passenger_count'].astype(int) # 将乘客数量转换为整数类型
# 将数据集分成特征和标签
X = taxi_data.drop('fare_amount', axis=1)
y = taxi_data['fare_amount']
# 将数据集分成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树分类器
dtc = DecisionTreeClassifier()
# 训练模型
dtc.fit(X_train, y_train)
# 做出预测
y_pred = dtc.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
```
此代码假设您的出租车数据已经存储在一个名为`taxi_data.csv`的文件中,并且您已经安装了必要的Python库(如pandas、scikit-learn等)。代码首先加载数据集,然后进行一些预处理步骤,例如删除不需要的列、删除缺失数据等。接下来,代码将数据集分成特征和标签,并将其拆分为训练集和测试集。然后,代码创建一个决策树分类器,并使用训练数据对其进行训练。最后,代码使用测试数据做出预测,并计算模型的准确率。
阅读全文