Python神经网络教程:前向反向传播详解
时间:2026-01-11 08:20:34 209浏览 收藏
学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《Python神经网络教程:前向与反向传播详解》,以下内容主要包含等知识点,如果你正在学习或准备学习文章,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!
前向传播是输入数据经加权求和、加偏置、激活函数逐层变换得到输出的过程,不更新参数;反向传播利用链式法则从损失函数梯度出发,逐层计算权重与偏置的梯度并更新。

前向传播:数据怎么“流过”神经网络
前向传播是神经网络做预测的过程:输入数据从输入层开始,逐层经过加权求和、加偏置、激活函数变换,最终得到输出。比如一个两层网络(含1个隐藏层),计算过程是:
- 隐藏层输出 = 激活函数(输入 × 权重₁ + 偏置₁)
- 输出层输出 = 激活函数(隐藏层输出 × 权重₂ + 偏置₂)
常用激活函数如ReLU(max(0, x))或Sigmoid(1 / (1 + exp(-x))),它们让网络能拟合非线性关系。注意:前向传播不更新参数,只产生预测值和中间结果——这些中间结果在反向传播时会被复用。
反向传播:误差怎么“流回来”更新参数
反向传播的本质是链式法则的工程实现:从损失函数对输出的梯度出发,逐层往回计算损失对每个权重和偏置的偏导数。核心步骤是:
- 计算输出层误差项(如:预测值与真实标签的差 × 输出层激活函数导数)
- 用该误差项乘以前一层输出,得到对当前层权重的梯度
- 用误差项乘以1,得到对当前层偏置的梯度
- 将误差项传递到前一层(乘以上一层权重转置,再乘该层激活函数导数)
例如,用均方误差(MSE)和Sigmoid激活时,输出层误差项 = (y_pred − y_true) × y_pred × (1 − y_pred);ReLU的导数在x>0时为1,在x≤0时为0,实际编码中常写成 (x > 0).astype(float)。
手动实现一小段前向+反向代码(无框架)
理解原理最直接的方式是手写一个单隐藏层网络的关键片段:
# 前向 z1 = X @ W1 + b1 # 隐藏层加权和 a1 = np.maximum(0, z1) # ReLU z2 = a1 @ W2 + b2 # 输出层加权和 y_pred = 1 / (1 + np.exp(-z2)) # Sigmoid输出 <h1>反向(假设MSE损失)</h1><p>d_loss_dz2 = (y_pred - y_true) <em> y_pred </em> (1 - y_pred) # 输出层误差项 d_loss_dW2 = a1.T @ d_loss_dz2 d_loss_db2 = np.sum(d_loss_dz2, axis=0)</p><p>d_loss_da1 = d_loss_dz2 @ W2.T d_loss_dz1 = d_loss_da1 * (z1 > 0) # ReLU导数 d_loss_dW1 = X.T @ d_loss_dz1 d_loss_db1 = np.sum(d_loss_dz1, axis=0)</p><h1>更新权重(SGD)</h1><p>W1 -= lr <em> d_loss_dW1 b1 -= lr </em> d_loss_db1 W2 -= lr <em> d_loss_dW2 b2 -= lr </em> d_loss_db2 </p>
为什么容易卡在反向传播?几个关键提醒
初学反向传播常因细节出错导致梯度为0或爆炸。注意:
- 矩阵维度必须对齐:W1.shape = (input_dim, hidden_dim),X.shape = (batch_size, input_dim),所以 X @ W1 合理;反向时 d_loss_dW1 = X.T @ d_loss_dz1,形状才匹配
- 激活函数导数不能漏:Sigmoid导数不是“1−y”,而是“y×(1−y)”;ReLU导数不是常数1,需按输入值分段
- 批量训练时,对偏置的梯度要沿 batch 维度求和(np.sum(..., axis=0)),否则形状错
- 初始化权重不能全零:会导致所有神经元学习相同特征,梯度对称失效;推荐用小随机数,如 np.random.randn(...) * 0.01
理论要掌握,实操不能落!以上关于《Python神经网络教程:前向反向传播详解》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
313 收藏
-
355 收藏
-
454 收藏
-
197 收藏
-
428 收藏
-
272 收藏
-
489 收藏
-
163 收藏
-
355 收藏
-
456 收藏
-
275 收藏
-
182 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习