Uploaded by re0 emt0

第二章作业

advertisement
第⼆章作业.md
2023-10-20
1. 假设有⼀个只有1个隐层的多层感知机,其输⼊、隐层、输出层的神经
元个数分别为33、512、10,那么这个多层感知机中总共有多少个参数是
可以被训练的?
模型参数包括2个权重矩阵和2个偏置向量:
第⼀层的权重矩阵有33*512个变量,偏置向量有512个变量,第⼀层共17408个变量;
第⼆层的权重矩阵有512*10个变量,偏置向量有10个变量,第⼆层共5130个变量.
这个多层感知机总共有22538个参数是可以被训练的.
2. 反向传播中,神经元的梯度是如何计算的?权重是如何更新的?
. 根据神经⽹络计算出的值和期望值计算损失函数的值L(W)。
. 计算损失函数对每个权重或者偏置的偏导,复合函数的偏导根据复合函数的 求导法则进⾏求解。
. 根据w = w - η * 偏导数 进⾏参数的更新操作。(其中η为超参数学习率)
. 通过多轮迭代完成参数的更新,以缩⼩计算值和真实值之间的误差。
3. 请在同⼀个坐标系内画出五种不同的激活函数图像,并⽐较它们的取
值范围。
Leaky ReLU (α=0.01)、紫⾊:ELU (α=1.0)
1/2
第⼆章作业.md
2023-10-20
v
4.假设激活函数的表达式为 ϕ(v) = √ 1+v
,请给出它的导数表达式并求出
其在原点的取值
2
1
√ 1+v2 −v⋅ 2 ⋅
ϕ (v) =
′
1+v2
2v
2
√1+v
=
1
3
(1+v2 ) 2
, ϕ (0) = 1.
′
2/2
Download