人工智能

神经网络

为什么一层层简单的节点，组合起来就能“看懂”图像和语言？

神经网络不是魔法，而是一种反复传递和调整参数的结构。它把输入一步步变换，直到输出更接近目标答案。

直接开始实验先看核心概念

先动手

先试一次，再理解原理

先拖动输入特征、切换模型偏好和激活函数，看看信号如何穿过层与权重，最后形成分类结果。

互动实验

水果分类神经网络实验台

把抽象的神经网络换成更符合直觉的任务：根据水果的甜度和细长度，判断它更像苹果还是香蕉。再通过训练回放，观察模型是怎么慢慢学会这件事的。

甜度不高、外形不细长，通常更接近苹果的特征。

当前样本：青苹果。直觉目标是判断它为什么更像“更像苹果”。

训练回放会展示：在训练初期模型如何经常犹豫，后来又怎样逐步学会把“甜度”和“细长度”结合起来。

预测类别更像香蕉

置信度52%

主导隐藏特征甜味感知

训练轮次Epoch 4

平均激活0.06

当前损失0.28

训练准确率94%

训练第 4 轮后，损失下降到 0.28，识别准确率约为 94%。训练后期，权重更加稳定，边界样本也会给出更合理的概率分布。

更像苹果48%

更像香蕉52%

快速认识

先用一句话知道它是什么

神经网络是一种把输入不断线性变换并经过激活函数筛选，最终得到输出的参数化模型。

理解主线

再把关键变化顺下来

每个节点都会接收信号、做一个简单计算，再把结果传给下一层。

单个节点能力很弱，但很多节点叠在一起，就能提取越来越复杂的特征。

训练的本质，是不断调整连接强弱，让输出更接近正确答案。

核心公式

用模型把关系写清楚

单层神经元

y = σ(Wx + b)

输入先按权重组合，再加上偏置，最后经过激活函数决定这个神经元输出多强。

符号含义

x 输入向量
W 权重矩阵或权重向量
b 偏置
σ 激活函数，如 ReLU 或 sigmoid
y 该层输出

适用说明

多层网络就是把这一步重复很多次。
实验里调整权重偏好，本质上是在改变 W 和 b。

核心概念

把最重要的三个点讲清楚

层数越深，表示越抽象

浅层通常先识别边缘和轮廓，深层再组合成更复杂的模式。

权重不是答案，而是偏好

它们决定哪些输入更重要，网络因此形成自己的判断路径。

激活让网络具备非线性

如果没有激活函数，多层网络会退化成简单线性变换，表达能力会大幅下降。

现实应用

这些场景真的会用到它

图像与语音识别

手机拍照识别、语音助手转写和工业视觉检测，底层都依赖神经网络提取特征。

生成式 AI

大语言模型、图像生成和多模态系统，本质上都建立在深层神经网络结构之上。

医疗与制造辅助决策

在医学影像筛查、缺陷检测和预测维护中，神经网络被用来发现复杂模式。

继续探索

继续探索：从神经网络走向反向传播、卷积网络与大语言模型。

返回首页继续浏览