softmax回归
分类问题:询问“哪一个”
通常不区分硬类别(样本属于哪个类别)和软类别(样本属于每个类别的概率):将硬类别当作软类别处理
分类数据表示:one-hot编码
- 类别对应的分量设为1,其余分量设为0
网络架构:
- 问题:输出无法直接作为概率使用
- 解决:softmax
softmax回归的输出层也是全连接层 对于d输入q输出的全连接层,开销为
softmax函数:将输出
- 定义:
- 性质:
- 归一化,非负性,可导
- 优化:小批量样本标准化
- 设批量大小为
, , , - 对
的每一行,先对所有项进行幂运算,再求和标准化softmax回归是线性模型
- 设批量大小为
损失函数:交叉熵损失函数
- 熵:
梯度:
- 推导:
预测:预测概率最高的类别作为输出类别
评估:精度