如果你过去一直在构建一些有监督的机器学习模型,你就会知道目标变量中的类别不平衡可能是一个大问题。这是因为在少数类中没有足够的例子来让算法学习模式。 一个解决方案是创建一些合成样本,通过使用例如SMOTE(合成少数群体过采样技术)来增加少数群体类的学习。 幸运的是,imbalance-learn库将帮助您在任何不平衡数据集上实现这一技术。 您可以通过在终端上执行以下命令来安装imbalance-learn库。 文章导航 统计学派的18种经典数据分析方式大数据制止网络安全威胁的5种可行方法