多层感知机与反向传播作业

第⼆章作业.md 2023-10-20 1. 假设有⼀个只有1个隐层的多层感知机，其输⼊、隐层、输出层的神经元个数分别为33、512、10，那么这个多层感知机中总共有多少个参数是可以被训练的？模型参数包括2个权重矩阵和2个偏置向量：第⼀层的权重矩阵有33*512个变量，偏置向量有512个变量，第⼀层共17408个变量；第⼆层的权重矩阵有512*10个变量，偏置向量有10个变量，第⼆层共5130个变量. 这个多层感知机总共有22538个参数是可以被训练的. 2. 反向传播中，神经元的梯度是如何计算的？权重是如何更新的？ . 根据神经⽹络计算出的值和期望值计算损失函数的值L(W)。 . 计算损失函数对每个权重或者偏置的偏导，复合函数的偏导根据复合函数的求导法则进⾏求解。 . 根据w = w - η * 偏导数进⾏参数的更新操作。（其中η为超参数学习率） . 通过多轮迭代完成参数的更新，以缩⼩计算值和真实值之间的误差。 3. 请在同⼀个坐标系内画出五种不同的激活函数图像，并⽐较它们的取值范围。 Leaky ReLU (α=0.01)、紫⾊：ELU (α=1.0) 1/2 第⼆章作业.md 2023-10-20 v 4.假设激活函数的表达式为 ϕ(v) = √ 1+v ,请给出它的导数表达式并求出其在原点的取值 2 1 √ 1+v2 −v⋅ 2 ⋅ ϕ (v) = ′ 1+v2 2v 2 √1+v = 1 3 (1+v2 ) 2 , ϕ (0) = 1. ′ 2/2

多层感知机与反向传播作业

Products

Support

多层感知机与反向传播作业

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib