Google发布多语种机器学习术语表：A/B测试与深度解析

需积分: 11 72 浏览量更新于2024-07-18 收藏 581KB PDF 举报

Google的机器学习术语表是由其工程教育团队精心编撰的资源，目的是为了帮助全球开发者理解和掌握机器学习的基本概念和TensorFlow相关术语。这份术语表涵盖了多语种版本，包括西班牙语、法语、韩语和简体中文，以满足不同地区用户的需求。在该术语表中，重要的概念有： 1. **A/B测试 (AA/B Testing)**: 这是一种常用的实验设计方法，用于比较两个或多个不同的技术方案，通常用于评估新功能或策略对业务的影响。A/B测试不仅能判断哪种技术更优，还能通过统计分析确定结果的显著性。 2. **准确率 (Accuracy)**: 在分类任务中，准确率指的是模型正确预测的样本比例。对于多类别分类，它衡量的是总预测正确的类别数量。而在二元分类中，准确率则是基于真正例（TP）和真负例（TN）的计算。 3. **激活函数 (Activation Function)**: 激活函数在神经网络中扮演关键角色，它们是非线性的，将上一层的输入转换为下一层的输出，如ReLU和S型函数，引入了模型的非线性能力。 4. **AdaGrad**：这是一种优化算法，通过自适应地调整每个参数的学习率，使每个参数的学习过程独立进行，提高模型的效率。论文《Adaptive Subgradient Methods for Online Learning and Stochastic Optimization》提供了详细的理论支持。 5. **ROC曲线 (Receiver Operating Characteristic Curve) 和 AUC (Area Under the ROC Curve)**: AUC是评估分类器性能的一种指标，它考虑了所有可能的分类阈值，表示分类器在不同阈值下的真阳性率和假阳性率之间的平衡能力。 6. **反向传播算法 (Backpropagation)**: 是神经网络中训练模型的关键算法，通过前向传播计算每个节点的输出，再通过反向传播计算误差并调整权重，实现梯度下降。 7. **基准 (Baseline)**: 作为评估模型性能的参照标准，简单的模型或策略可以用来确定实际期望的效果范围，帮助开发者设定合理的改进目标。 8. **批次 (Batch)**: 在模型训练过程中，一批数据（或一组样本）用于一次梯度更新，这组数据称为一个批次。批次大小决定了每次迭代处理的数据量，如SGD（随机梯度下降）中，批次大小就是每次更新所用样本的数量。这些概念在机器学习和深度学习中至关重要，理解并熟练运用这些术语能够帮助开发人员更好地构建和优化模型，提升AI系统的性能。

 L2 损失函数

 对数损失函数

 L1 正则化

 L2 正则化

梯度下降法的很多变体都一定能找到一个接近严格凸函数最小值的点。

同样，随机梯度下降法的很多变体都有很高的可能性能够找到接近严格

凸函数最小值的点（但并非一定能找到）。

两个凸函数的和（例如 L2 损失函数 + L1 正则化）也是凸函数。

深度模型绝不会是凸函数。值得注意的是，专门针对凸优化设计的算法

往往总能在深度网络上找到非常好的解决方案，虽然这些解决方案并不

一定对应于全局最小值。

凸优化 (convex optimization)

使用数学方法（例如梯度下降法）寻找凸函数最小值的过程。机器学习

方面的大量研究都是专注于如何通过公式将各种问题表示成凸优化问题，

以及如何更高效地解决这些问题。

如需完整的详细信息，请参阅 Boyd 和 Vandenberghe 合著

的 Convex Optimization（《凸优化》）。

凸集 (convex set)

欧几里得空间的一个子集，其中任意两点之间的连线仍完全落在该子集

内。例如，下面的两个图形都是凸集：

剩余52页未读，继续阅读

Burgess_ni

粉丝: 67
资源: 21

Google发布多语种机器学习术语表：A/B测试与深度解析

谷歌机器学习术语表

机器学习术语表

Google机器学习速成课程.pdf

机器学习术语表和TensorFlow专用术语.pdf

机器学习&人工智能_cn_zh-CN.pdf

Matrix_Analysis_2nd_Horn.pdf

barra_risk_model_handbook.pdf

机器学习算法总结_决策树.pdf

机器学习术语表GoogleDevelopers.pdf

Google机器学习术语表.pdf

最新资源