多层感知机
在本章中,我们将第一次介绍真正的深度网络。最简单的深度网络称为多层感知机。多层感知机由多层神经元组成,每一层与它的上一层相连,从中接收输入;同时每一层也与它的下一层相连,影响当前层的神经元。当我们训练容量较大的模型时,我们面临着过拟合的风险。因此,本章将从基本的概念介绍开始讲起,包括过拟合、欠拟合和模型选择。为了解决这些问题,本章将介绍权重衰减和暂退法等正则化技术。我们还将讨论数值稳定性和参数初始化相关的问题,这些问题是成功训练深度网络的关键。在本章的最后,我们将把所介绍的内容应用到一个真实的案例:房价预测。关于模型计算性能、可伸缩性和效率相关的问题,我们将放在后面的章节中讨论。
细分章节
- 10-mlp:多层感知机介绍;
- 20-mlp-from-scratch:MLP 从零实现;
- 30-mlp-concise-implementation:MLP 简洁实现;
- 40-underfit-overfit:欠拟合、过拟合介绍与化解;
- 50-weight-decay:权重衰减策略;
- 60-dropout:暂推法介绍;
- 70-backprop:前向传播与后向传播;
- 80-numerical-stability-and-init:处理梯度爆炸和梯度消失;
- 90-environment:应对环境偏移问题;