常用损失函数

损失函数

损失函数：用于衡量模型预测结果与真实结果之间的差异或误差。

损失函数的使用场景：

二分类问题：二元交叉熵损失函数（Binary Cross-Entropy Loss）

计算公式： $\large L(y, p) = -[y * log(p) + (1 - y) * log(1 - p)]$

注：真实标签为 y（可以是0或1），模型的预测概率为 p（0 ≤ p ≤ 1）

多分类问题：多元交叉熵损失函数（Multiclass Cross-Entropy Loss）

在多元交叉熵损失函数中，假设有 C 个可能的类别，每个类别都有一个与之相关的标签（通常使用 one-hot 编码）。对于每个样本，模型会输出一个长度为 C 的概率分布向量，表示样本属于每个类别的概率。

注：其中，i 表示类别的索引，$y_i$ 表示真实标签的第 i 个元素，$p_i$ 表示模型的输出概率分布的第 i 个元素。

Focal Loss:用于处理类别不平衡问题的损失函数,旨在解决当某些类别的样本数量远远多于其他类别时，传统的交叉熵损失函数会受到类别不平衡的影响，导致模型难以有效地学习少数类别。

focal loss的具体形式： $\large-\alpha(1-y_{pred})^{\gamma}y_{true}log(y_{pred})-(1-\alpha)y_{pred}^{\gamma}(1-y_{true})log(1-y_{pred})$

注：

1.$\large\gamma$通常设置为2，$\large(1-y_{pred})^{\gamma}$相当于样本的难易度权值,$\large\alpha$为正负样本的比例

2.为了防止难易样本的频繁变化，应当选取小的学习率。防止学习率过大，造成w变化较大从而引起 $\large y_{pred}$的巨大变化，造成难易样本的改变。

计算公式：$\large MSE = (1/N) * Σ(y_i - ŷ_i)^2$

注：N 表示样本数量，$y_i$ 表示真实标签，$ŷ_i$ 表示模型的预测值。

计算公式：$\large MAE = (1/N) * Σ|y_i - ŷ_i|$

注：N 表示样本数量，$y_i$ 表示真实标签，$ŷ_i$ 表示模型的预测值。