数据不平衡问题
发布时间:2022-09-13 17:45:30
发布人:wjy
这主要是由于数据分布不平衡造成的。解决方法如下:
1. 采样,对小样本加噪声采样,对大样本进行下采样
2. 数据生成,利用已知样本生成新的样本
3. 进行特殊的加权,如在Adaboost中或者SVM中
4. 采用对不平衡数据集不敏感的算法
5. 改变评价标准:用AUC/ROC来进行评价
6. 采用Bagging/Boosting/ensemble等方法
7. 在设计模型的时候考虑数据的先验分布
下一篇什么是Redis?