softmax 分类

技术softmax 分类 softmax 分类为什么softmax 里面要用交叉熵这个问题之前困扰我挺久的,但这两篇博文完美解答了我的疑惑。交叉熵、相对熵和负对数似然的理解 - 最大的梦想家的文章 -

最大分类

为什么要在softmax中使用交叉熵这个问题困扰了我很久,但这两篇博文完美地回答了我的疑问。

对交叉熵、相对熵和负对数似然的理解——最伟大的dreamer-https://zhuanlan.zhihu.com/p/268171298,之虎的文章

库尔巴克-莱布勒散度-灰色Articles-https://zhuanlan.zhihu.com/p/100676922,知乎简介

KL散度

KL散度是原始分布和近似分布(即学习分布)之间差异的度量。如果差异较大,则意味着学习到的近似分布不太拟合。

\[d _ { KL }(p \ parallel q)=\sum_{i=1}^n p _ I(log(p _ I)-log(q _ I))\ \

S(P)=\sum_{i=1}^K p_i\log p_i\\

交叉熵=-\sum_{i=1}^K p_i \log q_i \\

交叉熵(y_{true},y _ { pred })=-\sum_{i=1}^k y _ { true }(I)\ log y _ { pred }(I)\

\】可以看出,KL散度实际上是实际分布的熵s,加上预测分布和实际分布的交叉熵,机器学习的目的是最小化KL散度,因为KL散度越小,两个分布越接近,这意味着我们从学习中得到的分布越接近实际分布。

对数似然

假设我们观察了一系列样本,包括A情况下的A,B情况下的B,c情况下的c,我们的目标是什么?找出一组分布(p(a) p(b) p(c))使这种状态的概率最高。

因为机器学习是一种分布。

那么我们的目标是最大化

对数是\(a\log p(a) b\log p(b) c \log p(c)\)

其实我们会这样表达:\(\ sum _ { I=1 } n _ I \ log p _ I \)

我们的目标是最大化这个似然函数。在某些情况下,它有一个解决方案。比如在前面的概率论中,我们取导数求极值点,然后得到分布函数。但是在机器学习中,我们通过学习得到分布,没有精确的函数。

还记得之前的交叉熵吗?

对数似然\(\ sum _ { I=1 } n n _ I \ log p _ I \)可以除以\(\ sum _ { I=1 } n n _ I \),因为这个值是一个常数,那么你得到3360。

\(\sum_{i=1}^n p _ { true }(I)\ log p _ { pred }(I)\)

哇哦!

这不就是之前交叉熵的负数吗?

因此,从另一个角度来考虑对数似然性,最大化对数似然性实际上就是最小化KL散度,因为我们的目标是找到一组最接近真实分布的预测分布。

在这一点上,我们得出结论,负对数似然是交叉熵。

为什么我们可以用交叉熵来作为损失函数

在之前的KL散度中,有——个具有两个分量的自熵S和交叉熵。

在深度学习分类中,我们使用一组onehot向量,(0,0,0,1,0,0)作为标签,这意味着$ p _ j=1 \ quad和\ quad p _ {I | I \ neq j}=0 $,所以,\ s(p(交叉熵=-\sum_{i=1}^k p _ I \ log q _ I=-p _ j \ log q _ j=-\ log q _ j \)

这个交叉熵与前面提到的负对数似然一致。

这就是为什么交叉熵可以用作损失函数。

SoftMax 梯度下降

等着填坑.

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/77292.html

(0)

相关推荐

  • 馒头冷冻能保存多久,馒头一般保存多久还可以吃

    技术馒头冷冻能保存多久,馒头一般保存多久还可以吃你好!我是美食领域创作者娜小厨 ,很高兴可以为你解答问题馒头冷冻能保存多久。馒头属于发面类面食,内部结构宣软蓬松 气孔较多 。特别容易滋生细菌 。尤其是黄曲霉菌 。曲霉特别

    生活 2021年10月22日
  • 平面法向量的求法,平面方程和法向量的关系及证明

    技术平面法向量的求法,平面方程和法向量的关系及证明所谓平面的法向量,就是与平面垂直的一个向量,它就是由平面方程中三个未知数的系数所组成的向量。 它们的关系可如此证明平面法向量的求法: 设向量(A,B,C)是一个过点(x0

    生活 2021年10月20日
  • Idea下仓库初始化与文件提交涉及到的基本命令有哪些

    技术Idea下仓库初始化与文件提交涉及到的基本命令有哪些小编给大家分享一下Idea下仓库初始化与文件提交涉及到的基本命令有哪些,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!一、Idea下仓库初始化与文件

    攻略 2021年12月9日
  • 外键约束

    技术外键约束 外键约束外键:外键约束是指表中某个字段的值依赖于另一张表中某个字段的值,而被依赖的字段必须且有主键约束或者唯一约束。
    被依赖的表我们通常称之为父表或者主表,设置外键约束的表称为字表或从表。

    礼包 2021年12月15日
  • 纸牌游戏程序设计(用c语言做卡牌游戏教程)

    技术怎样用C语言实现纸牌游戏今天就跟大家聊聊有关怎样用C语言实现纸牌游戏,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。1. 基本要求一副没有花牌(J、Q、K、A、

    攻略 2021年12月18日
  • Redis数据结构中的String类型有哪些

    技术Redis数据结构中的String类型有哪些这篇文章主要介绍“Redis数据结构中的String类型有哪些”,在日常操作中,相信很多人在Redis数据结构中的String类型有哪些问题上存在疑惑,小编查阅了各式资料,

    攻略 2021年12月10日