(18)tensorflow误差loss简介

tech2025-12-10  1

误差loss, E \Epsilon E

误差计算

E = g ( f θ ( x ) , y ) \Epsilon = g(f_\theta(x),y) E=g(fθ(x),y)

f θ ( x ) f_\theta(x) fθ(x)为当前模型下y的预测值 g ( . ) g(.) g(.)为误差的计算方式

优化目标

根据训练集计算,寻找一组 θ \theta θ使得loss最小公式表达为: θ ∗ = a r g m i n    g ( f θ ( x , y ) ) , x ∈ D t r a i n \theta^*=argmin\ \ g(f_\theta(x,y)), x \in D^{train} θ=argmin  g(fθ(x,y)),xDtrain

梯度下降法更新参数

θ ′ = θ − η ∗ ▽ θ ∗ E \theta^{'} =\theta-\eta*\bigtriangledown_\theta*\Epsilon θ=θηθE η \eta η:学习率 ▽ θ \bigtriangledown_\theta θ:梯度 E \Epsilon E:误差loss

最新回复(0)