机器学习术语详解与 TensorFlow 专用词汇

需积分: 10 165 浏览量更新于2024-07-19 收藏 990KB PDF 举报

"机器学习术语表，包含了通用的机器学习术语和TensorFlow特有术语的定义，例如A/B测试、准确率、激活函数等。这个术语表有助于理解机器学习的基本概念和技术，对于学习和实践机器学习非常有帮助。" 在机器学习领域，掌握基本的术语是至关重要的，以下是一些关键概念的详细解释： 1. **A/B测试**：A/B测试是一种统计方法，通过对比两种或多种技术来决定哪一种更优。它常用于产品优化，例如比较不同版本的网页设计或营销策略，以确定哪种设计或策略能带来更好的效果。通过随机分配用户到不同的组别，可以量化和验证结果的显著性。 2. **准确率**：准确率是衡量分类模型性能的指标，表示模型正确预测的样本占总样本的比例。在二元分类中，准确率等于真正例（实际正类被正确预测为正类）和真负例（实际负类被正确预测为负类）之和除以样本总数。在多类别分类中，计算方式有所不同，通常需要结合其他指标如精确率和召回率一起评估。 3. **激活函数**：在神经网络中，激活函数用于引入非线性，使得网络能够学习更复杂的模式。常见的激活函数包括ReLU（Rectified Linear Unit），其输出为输入的正部分；以及S型函数（sigmoid），它将输入压缩到0到1之间，常用于二元分类问题的输出层。 4. **AdaGrad**：AdaGrad是一种优化算法，用于更新模型参数的梯度下降法。它通过为每个参数自适应地调整学习速率，使得稀疏数据中的参数更新更快，而频繁出现的数据项的更新则更慢。这有助于避免过拟合并加速训练过程。 5. **ROC曲线和AUC**：ROC曲线描绘了真阳性率（True Positive Rate）与假阳性率（False Positive Rate）之间的关系，用于评估二元分类模型的性能。ROC曲线下的面积（AUC）是模型区分正负类能力的度量，值越接近1，表示模型性能越好。这只是机器学习术语表中的一部分内容，完整的术语表涵盖了更多关键概念，如损失函数、梯度下降、正则化、过拟合、欠拟合、神经网络架构等。掌握这些术语和它们背后的原理，对于深入理解机器学习及其应用至关重要。

2018/3/9 机器学习术语表 | 机器学习速成课程 | Google Developers

https://developers.google.cn/machine-learning/crash-course/glossary#regularization 8/43

梯度下降法(#gradient_descent)的很多变体都一定能找到一个接近严格凸函数最小值的点。同

样，随机梯度下降法(#SGD)的很多变体都有很高的可能性能够找到接近严格凸函数最小值的

点（但并非一定能找到）。

两个凸函数的和（例如 L

损失函数 + L

正则化）也是凸函数。

深度模型(#deep_model)绝不会是凸函数。值得注意的是，专门针对凸优化

(#convex_optimization)设计的算法往往总能在深度网络上找到非常好的解决方案，虽然这些解

决方案并不一定对应于全局最小值。

凸优化 (convex optimization)

使用数学方法（例如梯度下降法(#gradient_descent)）寻找凸函数(#convex_function)最小值的

过程。机器学习方面的大量研究都是专注于如何通过公式将各种问题表示成凸优化问题，以

及如何更高效地解决这些问题。

如需完整的详细信息，请参阅 Boyd 和 Vandenberghe 合著的 Convex Optimization

(https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf)（《凸优化》）。

凸集 (convex set)

欧几里得空间的一个子集，其中任意两点之间的连线仍完全落在该子集内。例如，下面的两

个图形都是凸集：

相反，下面的两个图形都不是凸集：

剩余42页未读，继续阅读

weixin_38307856

粉丝: 0
资源: 9

机器学习术语详解与 TensorFlow 专用词汇

机器学习专业术语（Google）

谷歌机器学习术语表

如何开始学习机器学习

python机器学习 教案

如何快速入门机器学习

机器学习南京大学课件

如何快速了解机器学习相关知识

mid机器学习2004年期中考试

机器学习中有硬聚类算法的概念吗

机器学习是怎样进行法律文本语义识别的，举例说明

最新资源

python机器学习教案