归一化
归一化(Normalization)是一种数据处理的方法, 处理后的数据被限制在某一个固定范围内,通常是 [0, 1] 或者 [-1, 1]。
在机器学习中,归一化是数据预处理的一个重要步骤,可以加快模型的收敛速度。
以下是几种常见的归一化方法:
Min-Max Normalization
Min-Max 归一化可以将数据调整到 [0, 1] 区间,最大值为 1,最小值为 0,其他数据以此为参照进行线性缩放。
X_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}}
Z-Score Normalization
Z-Score 归一化通过减去均值后除以标准差来实现,使得数据的均值为 0,标准差为 1,即呈现以 0 为轴的标准差为 1 的正态分布。
X_{std} = \frac{x - \mu}{\sigma}
License:
CC BY 4.0