第2章 神经网络与深度学习

神经网络是本书将要探讨的主要机器学习模型。神经网络在很多领域都有广泛应用,从计算机视觉(图像目标定位)到金融领域(金融诈骗检测),从贸易甚至到艺术领域。在这些应用中,神经网络与对抗训练过程共同用于建立模型,这些模型能够生成多种令人惊叹的、新的、前所未有的艺术。

本章可能是整本书中理论知识最丰富的一章,将展示如何定义神经网络以及如何训练它们学习。首先介绍用于人工神经元的数学公式,我们将重点介绍为什么神经元必须具有某些特征才能学习。之后详细解释全连接和卷积神经拓扑,因为这些几乎是所有神经网络架构的基础组成部分。同时,将介绍两个非常必要的概念——深度学习和深度架构,因为正是深度架构使得现在的神经网络能够以超人的表现解决一些挑战性问题。

最后,本章将介绍用于训练参数模型的优化过程与用于改善模型性能的正则化技术。梯度下降、链式规则和图表示计算都有专门章节进行介绍,因为对于任何机器学习从业者来说,当一个框架用于训练模型时,能够知道会发生什么是极为重要的。

如果你已经熟悉本章将要介绍的概念,则可以直接跳转进入第3章,该章专门用于介绍TensorFlow图架构。

本章将介绍以下主题:

·神经网络

·优化

·卷积神经网络

·正则化