神经网络是一种把输入不断线性变换并经过激活函数筛选,最终得到输出的参数化模型。
先动手
先试一次,再理解原理
先拖动输入特征、切换模型偏好和激活函数,看看信号如何穿过层与权重,最后形成分类结果。
互动实验
水果分类神经网络实验台
把抽象的神经网络换成更符合直觉的任务:根据水果的甜度和细长度,判断它更像苹果还是香蕉。再通过训练回放,观察模型是怎么慢慢学会这件事的。
甜度不高、外形不细长,通常更接近苹果的特征。
当前样本:青苹果。直觉目标是判断它 为什么更像“更像苹果”。
训练回放会展示:在训练初期模型如何经常犹豫,后来又怎样逐步学会把“甜度”和“细长度”结合起来。
训练轮次Epoch 4
平均激活0.06
当前损失0.28
训练准确率94%
训练第 4 轮后,损失下降到 0.28,识别准确率约为 94%。训练后期,权重更加稳定,边界样本也会给出更合理的概率分布。
更像苹果48%
更像香蕉52%
快速认识
先用一句话知道它是什么
理解主线
再把关键变化顺下来
每个节点都会接收信号、做一个简单计算,再把结果传给下一层。
单个节点能力很弱,但很多节点叠在一起,就能提取越来越复杂的特征。
训练的本质,是不断调整连接强弱,让输出更接近正确答案。
核心公式
用模型把关系写清楚
单层神经元
y = σ(Wx + b)
输入先按权重组合,再加上偏置,最后经过激活函数决定这个神经元输出多强。
符号含义
- x 输入向量
- W 权重矩阵或权重向量
- b 偏置
- σ 激活函数,如 ReLU 或 sigmoid
- y 该层输出
适用说明
- 多层网络就是把这一步重复很多次。
- 实验里调整权重偏好,本质上是在改变 W 和 b。
核心概念
把最重要的三个点讲清楚
层数越深,表示越抽象
浅层通常先识别边缘和轮廓,深层再组合成更复杂的模式。
权重不是答案,而是偏好
它们决定哪些输入更重要,网络因此形成自己的判断路径。
激活让网络具备非线性
如果没有激活函数,多层网络会退化成简单线性变换,表达能力会大幅下降。
现实应用
这些场景真的会用到它
图像与语音识别
手机拍照识别、语音助手转写和工业视觉检测,底层都依赖神经网络提取特征。
生成式 AI
大语言模型、图像生成和多模态系统,本质上都建立在深层神经网络结构之上。
医疗与制造辅助决策
在医学影像筛查、缺陷检测和预测维护中,神经网络被用来发现复杂模式。
继续探索