• 2022-05-31
    如果使用sigmoid作为神经网络激活函数,由于在BP算法中,误差从输出层反向传播时,在每一层都要乘以该层激活函数的导数,所以可能会遇到前面层比后面层梯度变化更小且慢得多的情况,这种情况被称为__________。()
    A: 梯度消失;
    B: 梯度爆炸;
    C: 梯度上升;
    D: 梯度下降;
  • 举一反三