预测并提交待预测样本(test_price.csv)中车身类型(bodyType字段)为“微型车”,验证集submit.csv文件
时间: 2024-03-19 07:44:07 浏览: 57
首先,您需要加载模型并对测试集进行预测,然后将预测结果保存到CSV文件中,并与验证集文件进行比较,以确保预测结果的准确性。下面是一个简单的示例代码:
```python
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
import lightgbm as lgb
# 加载训练好的模型
model = lgb.Booster(model_file='model.txt')
# 加载测试集数据
test_data = pd.read_csv('test_price.csv')
# 对bodyType字段进行编码
le = LabelEncoder()
test_data['bodyType'] = le.fit_transform(test_data['bodyType'])
# 进行预测
y_pred = model.predict(test_data)
# 将预测结果保存到CSV文件中
result = pd.DataFrame({'price': y_pred})
result.to_csv('test_result.csv', index=False)
# 加载验证集数据
submit_data = pd.read_csv('submit.csv')
# 比较预测结果和验证集结果
submit_price = submit_data[submit_data['bodyType'] == '微型车']['price'].values
test_price = pd.read_csv('test_result.csv')['price'][test_data['bodyType'] == 0].values
diff = np.abs(submit_price - test_price)
print('MAE:', np.mean(diff))
```
在上面的代码中,我们首先加载训练好的模型,然后加载测试集数据,并对`bodyType`字段进行编码。接下来,我们使用模型对测试集进行预测,并将预测结果保存到CSV文件中。然后,我们加载验证集数据,并从中提取出车身类型为“微型车”的样本的价格,再从预测结果中提取出相应的价格,并计算它们的MAE(平均绝对误差)。如果MAE很小,则说明我们的预测结果很准确。
阅读全文