如果DEPT_NUM字段值中有MSFL00001，和CMBC99999，要得到MSFL0-MSFL00001跟MSCMB-CMBC99999，‘MS’||SUBSTR(DEPT_NUM,1,3)||‘-’||DEPT_NUM这个如何修改下

如果你想通过SQL查询获取 DEPT_NUM 字段值从 'MSFL00001' 到 'CMBC99999' 区间的字符串，你可以稍微调整你的表达式，使其仅包含指定范围内的部门编号。假设你想保留前三个字符并添加区间分隔符，可以这样做： ```sql SELECT SUBSTRING('MS', 1, 2) || SUBSTR(DEPT_NUM, INSTR(DEPT_NUM, 'M') + 2, 3) || '-' || CASE WHEN DEPT_NUM = 'CMBC99999' THEN 'CMBC' ELSE SUBSTR(DEPT_NUM, INSTR(DEPT_NUM, 'C') + 2, 4) END AS formatted_dept_num FROM your_table WHERE DEPT_NUM BETWEEN 'MSFL00001' AND 'CMBC99999'; ``` 在这个查询中，`INSTR()` 函数用于查找 'M' 或 'C' 的位置，然后 `SUBSTR()` 用于提取相应的部分。对于最后一个值 'CMBC99999'，我们直接取 'CMBC' 避免截断。请注意，这个查询假设你的表名是 `your_table`，如果实际表名不同，你需要替换它。另外，如果你的数据中还可能存在其他形式的部门编号，这个查询可能需要进一步调整。

def xgb_cv(max_depth, learning_rate, n_estimators, gamma, min_child_weight, subsample, colsample_bytree): date_x = pd.read_csv('Train_data1.csv') # Well logging data date_x.rename(columns={"TC": 'label'}, inplace=True) date_x.drop('Depth', axis=1, inplace=True) date_x.drop('MSFL', axis=1, inplace=True) date_x.drop('CNL', axis=1, inplace=True) date_x.drop('AC', axis=1, inplace=True) date_x.drop('GR', axis=1, inplace=True) data = date_x.iloc[2:42, :] label = data.iloc[:, 1:2] data2 = data.iloc[:, :7] train_x, test_x, train_y, test_y = train_test_split(data2, label, test_size=0.5, random_state=0) xgb_train = xgb.DMatrix(train_x, label=train_y) xgb_test = xgb.DMatrix(test_x, label=test_y) params = { 'eval_metric': 'rmse', 'max_depth': int(max_depth), 'learning_rate': learning_rate, 'n_estimators': int(n_estimators), 'gamma': gamma, 'min_child_weight': int(min_child_weight), 'subsample': subsample, 'colsample_bytree': colsample_bytree, 'n_jobs': -1, 'random_state': 42 } # 进行交叉验证 cv_result = xgb.cv(params, xgb_train, num_boost_round=100, early_stopping_rounds=10, stratified=False) return -1.0 * cv_result['test-rmse-mean'].iloc[-1] # 定义参数范围 pbounds = {'max_depth': (3, 10), 'learning_rate': (0.01, 0.3), 'n_estimators': (50, 200), 'gamma': (0, 10), 'min_child_weight': (1, 10), 'subsample': (0.5, 1), 'colsample_bytree': (0.1, 1)} # 进行贝叶斯优化，找到最优超参数 optimizer = BayesianOptimization(f=xgb_cv, pbounds=pbounds, random_state=42) optimizer.maximize(init_points=5, n_iter=25) # 输出最优结果 print(optimizer.max) model = xgb.train(optimizer.max, xgb_train) model.save_model("model3.xgb") return optimizer.max

这个函数中包括了使用 xgboost 进行交叉验证、贝叶斯优化和训练模型的过程。在这个函数中，你需要传入 7 个参数，分别是 `max_depth`、`learning_rate`、`n_estimators`、`gamma`、`min_child_weight`、`subsample` 和 `colsample_bytree`。这个函数首先读入训练数据，然后对数据进行预处理，包括删除某些列和分割数据集。接下来，它将使用 xgboost 提供的 `xgb.cv()` 函数进行交叉验证，并返回最优模型的 rmse 值。然后，它定义了超参数的范围，并使用贝叶斯优化算法寻找最优超参数。最后，它训练了一个 xgboost 模型，并将其保存到文件中。你可以按照以下方式调用该函数，并传入所需的 7 个参数的值： ``` params1 = xgb_cv(max_depth=5, learning_rate=0.1, n_estimators=100, gamma=0.1, min_child_weight=1, subsample=0.8, colsample_bytree=0.8) ``` 其中，你可以根据你的具体需求，设置这些参数的值，以得到最佳的 xgboost 模型。

阅读全文

如果DEPT_NUM字段值中有MSFL00001，和CMBC99999，要得到MSFL0-MSFL00001跟MSCMB-CMBC99999，‘MS’||SUBSTR(DEPT_NUM,1,3)||‘-’||DEPT_NUM这个如何修改下

相关推荐

msfl:MS手电筒

msfl:Mattermark 语义过滤语言

论文研究 - 严重非均质碳酸盐岩储层的岩石物理评价； 孔隙率估算中电子图像记录的使用

delmsfl_zip_metastock_

行业软件-GOCAD钻孔数据

OPPO 推搜广多业务多场景的统一预估引擎实践 (1).pdf

C#HR人事管理系统源码数据库 MySQL源码类型 WebForm

量化投资技术实验报告指导-实验任务与评估标准解析

ioDraw-v3.1.0-mac-x64.dmg，流程图、思维导图、甘特图绘制软件，macOS x64版

计算机网络 - 思科模拟器 - Cisco Packet Tracer 令牌.zip

电力信号分离中的新型DNN-HMM监督方法

java校园跑腿综合服务网平台小程序源码带部署搭建教程数据库 MySQL源码类型 WebForm

电子通讯领域中达锂电子UART/485通讯协议详解与应用

复杂业务场景下的 Flutter 混合开发技术实践.pdf

C#CS小型医院HIS门诊挂号收费管理系统源码数据库 SQL2008源码类型 WinForm

yolo算法-皮肤问题检测数据集-2659张图像带标签-眼袋-皱纹-皮肤发红-油性皮肤-干性皮肤-黑斑-黑头-毛孔-痤疮.zip

课程设计-基于MATLAB的汽车出入库计时计费系统+项目源码+文档说明+课题介绍+GUI界面

java版快速开发框架后台管理系统源码数据库 MySQL源码类型 WebForm

【重磅，更新!】全国地级市POI兴趣点数据(2023年)

最新推荐

OPPO 推搜广多业务多场景的统一预估引擎实践 (1).pdf

C#HR人事管理系统源码数据库 MySQL源码类型 WebForm

量化投资技术实验报告指导-实验任务与评估标准解析

ioDraw-v3.1.0-mac-x64.dmg，流程图、思维导图、甘特图绘制软件，macOS x64版

计算机网络 - 思科模拟器 - Cisco Packet Tracer 令牌.zip

平尾装配工作平台运输支撑系统设计与应用

管理建模和仿真的文件

MATLAB遗传算法探索：寻找随机性与确定性的平衡艺术

如何在S7-200 SMART PLC中使用MB_Client指令实现Modbus TCP通信？请详细解释从连接建立到数据交换的完整步骤。

MAX-MIN Ant System：用MATLAB解决旅行商问题

论文研究 - 严重非均质碳酸盐岩储层的岩石物理评价；孔隙率估算中电子图像记录的使用