机器学习与深度学习常考知识点详解

需积分: 0 99 浏览量更新于2024-08-05 收藏 574KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"这篇文档是关于机器学习和深度学习领域的一些常见知识点的总结，包括了各种算法的定义、应用场景、核心原理以及与其他算法的对比。文档提到了线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯、随机森林、K-means聚类、GradientBoosting和AdaBoost等算法，并且特别讨论了激活函数ReLU及其优势以及BN（Batch Normalization）批标准化的作用。" 在机器学习和深度学习中，这些算法扮演着至关重要的角色： 1. **线性回归**：线性回归是一种预测连续数值型数据的模型，用于找出输入变量与输出变量之间的线性关系。Lasso回归和岭回归是其变种，分别通过正则化来解决过拟合问题，Lasso通过L1正则化促进特征选择，岭回归通过L2正则化保持所有特征。 2. **逻辑回归**：逻辑回归是二分类问题的常用方法，虽然名字中含有“回归”，但实际上是分类算法，通过sigmoid函数将线性得分映射到(0,1)之间，形成概率预测。 3. **决策树算法**：决策树是一种基于树形结构进行决策的模型，适用于分类任务。通过分裂数据集来构建树状结构，每个内部节点表示一个特征，每个分支代表一个特征值，而叶子节点表示类别决定。 4. **SVM（支持向量机）**：SVM是一种分类和回归方法，通过构造最大间隔超平面将数据分隔开，尤其在处理高维数据和小样本集时表现优秀。 5. **朴素贝叶斯（NB）**：基于贝叶斯定理的分类方法，假设特征之间相互独立，适合文本分类和其他领域。 6. **随机森林（RF）**：RF是集成学习的一种，由多个决策树组成，每个树的输出通过投票决定最终结果，能有效防止过拟合。 7. **K-means聚类**：无监督学习中的聚类算法，寻找数据的自然聚类结构，通过迭代调整簇中心和分配样本来实现。 8. **GradientBoosting和AdaBoost**：这两种都是提升方法，通过组合多个弱分类器形成强分类器。AdaBoost通过动态调整样本权重和弱分类器权重来优化，而GradientBoosting则是通过最小化残差平方和来逐步添加新的弱分类器。 9. **激活函数**：在神经网络中，激活函数如ReLU、sigmoid和tanh引入非线性，使得网络能学习更复杂的模式。ReLU因其避免梯度消失、减少过拟合和提高计算效率等优点而广泛使用。 10. **BN（批标准化）**：BN用于神经网络层间，通过标准化每一层的输入，加速训练过程，稳定梯度流，同时抑制过拟合，允许使用较大的学习率。这些算法各有优缺点，根据实际问题的特性和需求，选择合适的算法是关键。理解这些算法的核心原理并能灵活应用，是解决实际问题的基础。

资源详情

资源推荐

笔记本：机器学习

创建时间： 2019/6/21 14:06 更新时间： 2020/5/30 11:28

作者： beyourselfwb@163.com

URL： http://www.sohu.com/a/250971703_787107

ML/DL常考知识点

回答问题思路：

1、是什么？

2、适用场景？

3、核心原理？

4、跟其他对比？

常用的机器学习算法：

1、线性回归（回归） Lasso 回归、岭回归

2、逻辑回归（分类）

3、决策树算法（分类）见下文

4、SVM 支持向量机（分类）

5、NB 朴素贝叶斯（分类）见下文

6、RF 随机森林（分类）

7、K-means （聚类）

8、Gradient Boosting 和 AdaBoost算法

参考： https://blog.csdn.net/u012942818/article/details/74055224

https://github.com/imhuay/Algorithm_Interview_Notes-

Chinese/blob/a274dcee72324519e043c639f254a8596a10b912/A-

%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/A-

%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95.md#adab

%E7%AE%97%E6%B3%95

8、Gradient Boosting 和 AdaBoost算法

AdaBoost是一种集成学习算法，以分类任务为例，基本思想是将多个分类器组合成一个

强分类器。

两个核心点：（1）开始时，每个样本的权值是一样的，AdaBoost 的做法是提高上一轮

弱分类器错误分类样本的权值，同时降低那些被正确分类样本的权值。（2）AdaBoost

采取加权表决的方法（加法模型）。具体的，AdaBoost 会加大分类误差率小的基学习

器的权值，使其在表决中起到更大的作用，同时减小分类误差率大的基学习器的权值。

激活函数

常见的有：ReLU、sigmoid、tanh, softmax

下载后可阅读完整内容，剩余5页未读，立即下载

史努比狗狗

粉丝: 28
资源: 317

机器学习与深度学习常考知识点详解

Python_for_ML_and_DL-源码.rar

ML_DL_study:MLDL研究领域

{i_dl_data_i[DATA_IN_WIDTH-1]，i_dl_data_i}是什么意思

{i_dl_data_i[DATA_IN_WIDTH]，i_dl_data_i}

def _get_nexts(self): def _get_next_dl_batch(di, dl): try: batch = next(dl) except StopIteration: new_dl = iter(self._dataloaders[di]) self._iterators[di] = new_dl batch = next(new_dl) return batch return [_get_next_dl_batch(di, dl) for di, dl in enumerate(self._iterators)]什么意思

read_dl_model ('pretrained_dl_classifier_mobilenet_v2.hdl', DLModelHandle)

data_path = f"./data/{data_type}" train_dl, valid_dl, test_dl = dataloader.data_generator(data_path, configs, training_mode) logger.debug("Data loaded ...")解释这段代码

AttributeError: 'Test_dl' object has no attribute 'driver'

query_available_dl_devices

basedir='/home/tjnu_fmri/wangqiang/zhangbin/task97' for c in 203 205 do SUB=SUB${c} echo $SUB cd $basedir/$SUB/analysis/ if [ ! -d WQsgroup_DL.gfeat ] then sed -e "s/SUB201/$SUB/g" ../../SUB201/WQsgroup_DL.gfeat/design.fsf > group_DL.fsf feat group_DL.fsf & fi done

CAN DL=SF_DL

informer模型结果中informer_ETTh1_ftMS_sl192_ll96_pl48_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_test_0/true.npy代表什么含义

MTKPOWER_HINT_AUDIO_POWER_DL

[0xb821] ota log 06:46:45.326114 bcch_dl_sch / systeminformationblocktype1 b

..\..\Libraries\seekfree_peripheral\SEEKFREE_DL1B.c(305): error C67: 'dl1b_default_configuration': undefined identifier

将informer_ETTh1_ftMS_sl192_ll96_pl48_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_test_0/pred.npy中3d数组转成txt文件保存

halcon 执行set_dl_model_param算子时闪退

描述 资源 路径 位置 类型 ctc W505: implicit declaration of function "memset" zf_device_dl1a.c /LQ_TC264DA_LIB/src/User 第 551 行 C/C++ 问题

report ETL .ffff

最新资源

描述资源路径位置类型 ctc W505: implicit declaration of function "memset" zf_device_dl1a.c /LQ_TC264DA_LIB/src/User 第 551 行 C/C++ 问题