人工智能

神经网络

为什么一层层简单的节点,组合起来就能“看懂”图像和语言?

神经网络不是魔法,而是一种反复传递和调整参数的结构。它把输入一步步变换,直到输出更接近目标答案。

先动手

先试一次,再理解原理

先拖动输入特征、切换模型偏好和激活函数,看看信号如何穿过层与权重,最后形成分类结果。

互动实验

水果分类神经网络实验台

把抽象的神经网络换成更符合直觉的任务:根据水果的甜度和细长度,判断它更像苹果还是香蕉。再通过训练回放,观察模型是怎么慢慢学会这件事的。

甜度不高、外形不细长,通常更接近苹果的特征。

当前样本:青苹果。直觉目标是判断它 为什么更像“更像苹果”

训练回放会展示:在训练初期模型如何经常犹豫,后来又怎样逐步学会把“甜度”和“细长度”结合起来。

预测类别更像香蕉
置信度52%
主导隐藏特征甜味感知
训练轮次Epoch 4
平均激活0.06
当前损失0.28
训练准确率94%
参数调节甜度 42 · 细长度 18收起

训练第 4 轮后,损失下降到 0.28,识别准确率约为 94%。训练后期,权重更加稳定,边界样本也会给出更合理的概率分布。

0.42甜度0.18细长度0.17甜味感知0.00细长度感知0.00综合判断48%更像苹果52%更像香蕉
更像苹果48%
更像香蕉52%

快速认识

先用一句话知道它是什么

神经网络是一种把输入不断线性变换并经过激活函数筛选,最终得到输出的参数化模型。

理解主线

再把关键变化顺下来

每个节点都会接收信号、做一个简单计算,再把结果传给下一层。

单个节点能力很弱,但很多节点叠在一起,就能提取越来越复杂的特征。

训练的本质,是不断调整连接强弱,让输出更接近正确答案。

核心公式

用模型把关系写清楚

单层神经元

y = σ(Wx + b)

输入先按权重组合,再加上偏置,最后经过激活函数决定这个神经元输出多强。

符号含义

  • x 输入向量
  • W 权重矩阵或权重向量
  • b 偏置
  • σ 激活函数,如 ReLU 或 sigmoid
  • y 该层输出

适用说明

  • 多层网络就是把这一步重复很多次。
  • 实验里调整权重偏好,本质上是在改变 W 和 b。

核心概念

把最重要的三个点讲清楚

层数越深,表示越抽象

浅层通常先识别边缘和轮廓,深层再组合成更复杂的模式。

权重不是答案,而是偏好

它们决定哪些输入更重要,网络因此形成自己的判断路径。

激活让网络具备非线性

如果没有激活函数,多层网络会退化成简单线性变换,表达能力会大幅下降。

现实应用

这些场景真的会用到它

图像与语音识别

手机拍照识别、语音助手转写和工业视觉检测,底层都依赖神经网络提取特征。

生成式 AI

大语言模型、图像生成和多模态系统,本质上都建立在深层神经网络结构之上。

医疗与制造辅助决策

在医学影像筛查、缺陷检测和预测维护中,神经网络被用来发现复杂模式。

继续探索

继续探索:从神经网络走向反向传播、卷积网络与大语言模型。

返回首页继续浏览