全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货

标准化和归一化的区别和应用场景是什么?

发布时间:2023-10-15 01:35:39
发布人:xqq

1.定义不同

标准化(Standardization),也称为Z-score Normalization,是将数据按比例缩放,使之符合标准正态分布,即均值为0,标准差为1。而归一化(Normalization)通常是将数据缩放到[0,1]或者[-1,1]的范围内。

2.计算方法不同

标准化的计算方法是减去均值后除以标准差,而归一化通常是减去最小值后除以最大值和最小值的差。

3.使用场景不同

标准化通常用于需要计算距离的算法,如SVM,KNN,LR,以及神经网络等。而归一化适用于对参数大小敏感,或者最大最小值已知的场景,如梯度下降,深度学习等。

4.处理效果不同

标准化处理后的数据保持了原数据的分布形状,而归一化则更侧重于数据的尺度变换,不考虑数据的分布形状。

5.对异常值的影响不同

标准化由于涉及均值和标准差,对异常值比较敏感,异常值的存在可能会影响处理后数据的分布。而归一化则主要受到最大值和最小值的影响,对异常值相对鲁棒。

延伸阅读

选择标准化还是归一化

在实际的数据处理中,选择标准化还是归一化,主要取决于数据的特性和模型的需求:

1.如果数据的分布接近正态分布,那么标准化可能是一个更好的选择。因为标准化能够保持数据的分布形状,且许多机器学习算法(如线性回归,逻辑回归,支持向量机等)在设计时都假设输入数据是正态分布的。

2.如果数据存在异常值,或者最大最小值非常不稳定,归一化可能更为合适。因为归一化对异常值有较好的鲁棒性。

3.在深度学习中,由于激活函数(如sigmoid,tanh等)的输出范围有限,因此通常需要对输入数据进行归一化。

总的来说,标准化和归一化都有各自的优势,选择哪种方法需要根据实际应用场景和数据特性进行权衡。在不确定的情况下,可以都尝试一下,然后选择在验证集上效果较好的方法。

#it技术干货

相关文章

什么是梯度下降法?

什么是梯度下降法?

2023-10-15
行人重识别(re-ID)与跟踪(tracking)有什么区别?

行人重识别(re-ID)与跟踪(tracking)有什么区别?

2023-10-15
Coding和Github有什么区别?

Coding和Github有什么区别?

2023-10-15
卷积神经网络(CNN)和循环神经网络(RNN)有什么区别?

卷积神经网络(CNN)和循环神经网络(RNN)有什么区别?

2023-10-15

最新文章

常见网络安全面试题:Windows常用的命令有哪些?

常见网络安全面试题:Windows常用的命令有哪些?

2023-10-09
常见网络安全面试题:根据设备告警如何展开排查?

常见网络安全面试题:根据设备告警如何展开排查?

2023-10-09
常见网络安全面试题:mysql加固呢?(数据库加固)

常见网络安全面试题:mysql加固呢?(数据库加固)

2023-10-09
常见网络安全面试题:windows和linux加固?(操作系统加固)

常见网络安全面试题:windows和linux加固?(操作系统加固)

2023-10-09
在线咨询 免费试学 教程领取