深度学习中的常用概率函数:Logistic Sigmoid与Softplus

需积分: 2 92 下载量 119 浏览量 更新于2024-08-09 收藏 6.76MB PDF 举报
这篇教程主要介绍了在机器学习领域中常用的函数性质,特别是针对Synology群晖NAS用户可能在处理数据和模型训练时会遇到的概念。文章提到了两个关键的函数:逻辑斯谛(logistic sigmoid)函数和软加(softplus)函数。 1. **逻辑斯谛(Logistic Sigmoid)函数** - **定义**: 逻辑斯谛函数σ(x) = 1 / (1 + exp(-x)),公式(3.30)。 - **用途**: 这个函数常用于生成伯努利分布的参数ϕ,因为其输出范围限定在(0, 1)之间,这恰巧是伯努利参数的有效取值范围。 - **特性**: 当输入x的绝对值较大时,函数会饱和,即趋于0或1,导致对输入的变化不敏感,这种现象称为饱和现象。 2. **软加(Softplus)函数** - **定义**: 软加函数ζ(x) = log(1 + exp(x)),公式(3.31)。 - **应用**: 软加函数常用于生成正态分布的参数β和σ,由于其值域是(0, ∞),适合表示正实数。此外,它在处理包含逻辑斯谛函数的表达式时也常见。 3. **概率与信息论** - **概率**: 阐述了概率在机器学习中的重要性,包括随机变量、概率分布(离散和连续)、边缘概率、条件概率、独立性和条件独立性等基本概念。 - **伯努利分布**: 是二项分布的一种特殊情况,只考虑两种结果,成功与失败,常用于表示二元随机变量。 - **高斯分布**: 又称正态分布,是机器学习中常见的连续型概率分布,广泛应用于许多自然现象的数据建模。 4. **数值计算** - 提到了数值计算中可能出现的问题,如上溢和下溢,以及病态条件,这些都可能影响到模型的稳定性和计算的准确性。 - **梯度**和**偏导数矩阵**: 如雅可比矩阵和海森矩阵在优化过程中的作用,它们是计算模型参数变化率的关键工具。 - **基于梯度的优化方法**: 如梯度下降法,是机器学习中求解最小化问题的常见策略。 5. **机器学习基础** - 学习算法的构成要素:任务T、性能度量P、经验E,以线性回归为例进行了讲解。 - 容量、过拟合和欠拟合的概念,以及正则化作为防止过拟合的手段。 - 超参数和验证集的选择,以及交叉验证作为评估模型性能的方法。 这个教程深入浅出地介绍了机器学习中的一些核心概念,特别强调了逻辑斯谛和软加函数在概率分布和模型训练中的应用,同时涵盖了概率理论和数值计算的基础知识,对于Synology NAS用户进行数据分析和模型构建提供了实用指导。