神经网络是机器学习和深度学习的核心技术之一,它的灵感来源于生物神经元的工作方式。从最简单的感知机到复杂的多层神经网络,这一技术经历了数十年的发展,逐渐成为解决复杂问题的强大工具。本文将从感知机的基本原理出发,逐步深入讲解神经元结构、激活函数、前向传播和反向传播算法,帮助读者全面掌握神经网络的基础知识。
一、感知机:神经网络的起点
感知机(Perceptron)是神经网络的雏形,由 Frank Rosenblatt 在 1957 年提出。它是一种二分类模型,能够根据输入数据的特征进行线性分类。
1.1 感知机的结构
感知机由输入层和输出层组成。输入层接收多个特征值 ( x_1, x_2, \dots, x_n ),每个特征值乘以一个权重 ( w_1, w_2, \dots, w_n )。这些加权特征值相加后,再加上一个偏置项 ( b ),形成一个线性组合:
[
z = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b
]
最后,通过一个激活函数(例如阶跃