标准化和归一化的区别和应用场景是什么?-千锋教育

标准化和归一化的区别和应用场景是什么?

发布时间:2023-10-15 01:35:39

发布人:xqq

1.定义不同

标准化（Standardization），也称为Z-score Normalization，是将数据按比例缩放，使之符合标准正态分布，即均值为0，标准差为1。而归一化（Normalization）通常是将数据缩放到[0,1]或者[-1,1]的范围内。

2.计算方法不同

标准化的计算方法是减去均值后除以标准差，而归一化通常是减去最小值后除以最大值和最小值的差。

3.使用场景不同

标准化通常用于需要计算距离的算法，如SVM，KNN，LR，以及神经网络等。而归一化适用于对参数大小敏感，或者最大最小值已知的场景，如梯度下降，深度学习等。

4.处理效果不同

标准化处理后的数据保持了原数据的分布形状，而归一化则更侧重于数据的尺度变换，不考虑数据的分布形状。

5.对异常值的影响不同

标准化由于涉及均值和标准差，对异常值比较敏感，异常值的存在可能会影响处理后数据的分布。而归一化则主要受到最大值和最小值的影响，对异常值相对鲁棒。

延伸阅读

选择标准化还是归一化

在实际的数据处理中，选择标准化还是归一化，主要取决于数据的特性和模型的需求：

1.如果数据的分布接近正态分布，那么标准化可能是一个更好的选择。因为标准化能够保持数据的分布形状，且许多机器学习算法（如线性回归，逻辑回归，支持向量机等）在设计时都假设输入数据是正态分布的。

2.如果数据存在异常值，或者最大最小值非常不稳定，归一化可能更为合适。因为归一化对异常值有较好的鲁棒性。

3.在深度学习中，由于激活函数（如sigmoid，tanh等）的输出范围有限，因此通常需要对输入数据进行归一化。

总的来说，标准化和归一化都有各自的优势，选择哪种方法需要根据实际应用场景和数据特性进行权衡。在不确定的情况下，可以都尝试一下，然后选择在验证集上效果较好的方法。

#it技术干货

上一篇什么是IPMI?

下一篇MySQL小数的存储使用什么数据类型?

什么是梯度下降法?

2023-10-15

行人重识别（re-ID）与跟踪（tracking）有什么区别?

2023-10-15

Coding和Github有什么区别?

2023-10-15

卷积神经网络（CNN）和循环神经网络(RNN)有什么区别?

2023-10-15

校区精品课程

互联网前瞻热门课程从入门到成神

全国旗舰校区