如果使用sigmoid作为神经网络激活函数，由于在BP算法中，误差从输出层反向传播时，在每一层都要乘以该层激活函数的导数，所以可能会遇到前面层比后面层梯度变化更小且慢得多的情况，这种情况被称为__________。（） A: 梯度消失； B: 梯度爆炸； C: 梯度上升； D: 梯度下降；

2022-05-31

如果使用sigmoid作为神经网络激活函数，由于在BP算法中，误差从输出层反向传播时，在每一层都要乘以该层激活函数的导数，所以可能会遇到前面层比后面层梯度变化更小且慢得多的情况，这种情况被称为__________。（）
A: 梯度消失；
B: 梯度爆炸；
C: 梯度上升；
D: 梯度下降；

答案：

查看