import numpy as np class Node: j = None theta = None p = None left = None right = None class DecisionTreeBase: def __init__(self, max_depth, feature_sample_rate, get_score): self.max_depth = max_depth self.feature_sample_rate = feature_sample_rate self.get_score = get_score def split_data(self, j, theta, X, idx): idx1, idx2 = list(), list() for i in idx: value = X[i][j] if value <= theta: idx1.append(i) else: idx2.append(i) return idx1, idx2 def get_random_features(self, n): shuffled = np.random.permutation(n) size = int(self.feature_sample_rate * n) selected = shuffled[:size] return selected def find_best_split(self, X, y, idx): m, n = X.shape best_score = float("inf") best_j = -1 best_theta = float("inf") best_idx1, best_idx2 = list(), list() selected_j = self.get_random_features(n) for j in selected_j: thetas = set([x[j] for x in X]) for theta in thetas: idx1, idx2 = self.split_data(j, theta, X, idx) if min(len(idx1), len(idx2)) == 0 : continue score1, score2 = self.get_score(y, idx1), self.get_score(y, idx2) w = 1.0 * len(idx1) / len(idx) score = w * score1 + (1-w) * score2 if score < best_score: best_score = score best_j = j best_theta = theta best_idx1 = idx1 best_idx2 = idx2 return best_j, best_theta, best_idx1, best_idx2, best_score def generate_tree(self, X, y, idx, d): r = Node() r.p = np.average(y[idx], axis=0) if d == 0 or len(idx)<2: return r current_score = self.get_score(y, idx) j, theta, idx1, idx2, score = self.find_best_split(X, y, idx) if score >= current_score: return r r.j = j r.theta = theta r.left = self.generate_tree(X, y, idx1, d-1) r.right = self.generate_tree(X, y, idx2, d-1) return r def fit(self, X, y): self.root = self.generate_tree(X, y, range(len(X)), self.max_depth) def get_prediction(self, r, x): if r.left == None and r.right == None: return r.p value = x[r.j] if value <= r.theta: return self.get_prediction(r.left, x) else: return self.get_prediction(r.right, x) def predict(self, X): y = list() for i in range(len(X)): y.append(self.get_prediction(self.root, X[i])) return np.array(y)

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别项目源码实战

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

人脸识别项目实战

跟网型逆变器小干扰稳定性分析与控制策略优化simulink仿真模型和代码.zip

本仿真模型基于MATLAB/Simulink（版本MATLAB 2016Rb）软件。建议采用matlab2016 Rb及以上版本打开。（若需要其他版本可联系代为转换） CSDN详情地址：https://blog.csdn.net/qq_50594161/article/details/146242453sharetype=blogdetail&sharerId=146242453&sharerefer=PC&sharesource=qq_50594161&spm=1011.2480.3001.8118

16-1文本表示&词嵌入.ipynb

实战练习分词、创建词表、文本处理

相关推荐

python 3.74 运行import numpy as np 报错lib\site-packages\numpy\__init__.py

numpy-1.14.2-cp36-none-win_amd64.whl

TypeError: unsupported format string passed to NoneType.__format__

【CSP-J_S2复赛算法专题】：概率统计与计算几何问题的编码策略

【机器人学习与应用】：掌握KST_RoboTeam_31_zh.pdf中的10大核心原理

计算几何解密：构建几何元素的必备技能

搜索算法与AI：Python智能化搜索升级指南

机械手设计：从二维到三维的革命性转变

UR10运动学深入探讨：动态模型的应用与前沿技术

人工智能基础知识：算法与数据结构在AI中的巧妙应用

【编程世界的黑匣子】：揭秘20个不为人知的技术秘密

【川大数据结构与算法课后答案】：权威解析，助你彻底理解算法精髓

【算法设计高级技巧】：电子科技大学李洪伟教授的算法应用实例与案例分析

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

跟网型逆变器小干扰稳定性分析与控制策略优化simulink仿真模型和代码.zip

16-1文本表示&词嵌入.ipynb

大家在看

煤矿井下图像型早期火灾探测

PDK安装及cdl文件和gds文件的导入

SAP各模块字段与表的对应关系

蓝牙室内定位服务源码！

Cadence Allegro16.6高级进阶教程

最新推荐

Python 实现使用空值进行赋值 None

解决python cv2.imread 读取中文路径的图片返回为None的问题

解决keras,val_categorical_accuracy:,0.0000e+00问题

智慧园区3D可视化解决方案PPT(24页).pptx

掌握Android RecyclerView拖拽与滑动删除功能

【IBM HttpServer入门全攻略】：一步到位的安装与基础配置教程

[root@localhost~]#mount-tcifs-0username=administrator,password=hrb.123456//192.168.100.1/ygptData/home/win mount：/home/win：挂载点不存在

惠普8594E与IT8500系列电子负载使用教程

MATLAB与Python在SAR点目标仿真中的对决：哪种工具更胜一筹？

前端代理配置config.js配置proxyTable多个代理不生效

python 3.74 运行import numpy as np 报错lib\site-packages\numpy\init.py

TypeError: unsupported format string passed to NoneType.format

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集