使用LGBM对数据集建模的代码案例
时间: 2024-09-15 20:14:26 浏览: 58
数学建模数据集用户贷款数据集
使用LightGBM (Light Gradient Boosting Machine) 进行数据集建模的基本步骤通常包括数据预处理、模型训练和评估。这里是一个Python示例代码,假设我们已经有了一个名为`lgb_data.csv`的数据集:
```python
# 导入所需库
import pandas as pd
from sklearn.model_selection import train_test_split
import lightgbm as lgb
# 加载数据
data = pd.read_csv('lgb_data.csv')
# 数据预处理,例如特征选择、编码等
X = data.drop('target', axis=1) # 假设'target'是我们要预测的目标变量
y = data['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 将数据转换成LightGBM所需的DMatrix格式
train_data = lgb.Dataset(X_train, label=y_train)
test_data = lgb.Dataset(X_test, label=y_test)
# 设置模型参数
params = {
'boosting_type': 'gbdt', # 使用梯度提升算法
'objective': 'binary', # 对于二分类任务
'metric': 'accuracy', # 评估指标
'num_leaves': 31, # 树叶数
'learning_rate': 0.05, # 学习率
}
# 训练模型
model = lgb.train(params, train_data, num_boost_round=100, valid_sets=[test_data], early_stopping_rounds=10)
# 预测
predictions = model.predict(X_test)
# 评估模型性能
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions.round())
print(f"Accuracy on test set: {accuracy}")
#
阅读全文