首页

机器学习中非均衡数据集的处理方法？第1页

1

huang-xiao-ye-8 网友的相关建议:

做毕设碰到过类似的问题，也算小小研究过，就来不耻回答一下。。

推荐看一下Haibo He, Edwardo A. Garcia的Learning from Imbalanced Data这篇paper，写的很系统也很清晰。

主要包括四大类方法，1Sampling 2Cost Sensitive Methods 3Kernal-Based Methods and Active Learning Methods 4One-Class Learning or Novelty Detection Methods。

Sampling大类说到底就是两种可能。第一种是把多的那个组变少，第二种是把少的那个组变多，以达到平衡的结果。一般比较少用第一种，因为那样容易丢失重要信息。对于第二种，又有很多方法，最简单的是oversampling，由于其局限性，又有很多根据已有的数据生成新数据的方法，比如各种变体的synthetic sampling。

第二种思路是基于把多数组猜成少数组和把少数组猜成多数组的cost是不同的这个事实，来修正数据分布(个人理解可以当成采到样的概率)的方法。

另外，kernal类的模型，还可以通过修改核函数来偏移hyperplane，来抵消不平衡数据造成的hyperplane的偏移。

最后一大类没有看过相关paper，不了解。。

机器学习中非均衡数据集的处理方法？的其他答案点击这里

1

相关话题

  支持向量机（SVM）是什么意思？
  如何激怒一位人工智能（机器学习、深度学习、强化学习等）爱好者？
  image caption这个方向更偏向NLP还是CV？
  写深度学习代码是先写model还是dataset还是train呢，有个一般化的顺序吗？
  AI、VR、AR、大数据、云计算、区块链，哪些更有前景，哪些只是泡沫？
  一个无监督学习算法，如何判断其好坏呢?
  求通俗解释下bandit老虎机到底是个什么东西？
  推荐系统应该如何保障推荐的多样性？
  关于材料计算，模拟，仿真什么区别?
  加州大学伯克利分校为何能连续孵化出 Mesos,Spark,Alluxio,Ray 等重量级开源项目?

前一个讨论

为什么金庸、梁羽生、古龙之后再无武侠小说作家了呢？

下一个讨论

既然蛋蛋（睾丸）对动物的繁殖至关重要，为了降温直接吊在体外可以理解，但为什么不进化出有保护作用的蛋壳？

相关的话题

  大数据给我们的生活带来了哪些改变？
  怎么形象理解embedding这个概念？
  机器学习中使用正则化来防止过拟合是什么原理？
  HBase 和 Hive 的差别是什么，各自适用在什么场景中？
  双非小硕一枚能否从事机器学习?
  第七次全国人口普查主要数据将于 5 月 11 日公布，有哪些信息值得关注？
  为何总感觉人工智能和神经科学（神经网络）被绑在一起？
  如何解读「量子计算应对大数据挑战：中国科大首次实现量子机器学习算法」？
  如何评价Hinton组的新工作SimCLR?
  大数据显示美国新冠「零号病人」大概率 2019 年 4 月出现，有哪些科学依据？如果被证实意味着什么？
  如何评价 NVIDIA 最新技术 5 秒训练 NERF？
  如何理解MCMC中的细致平稳条件？
  各位大佬觉得联邦学习可以研究的问题有些什么小白了解一下这个水深不深?
  ICML2020有哪些值得关注的工作?
  机器学习中非均衡数据集的处理方法？
  有没有必要把机器学习算法自己实现一遍？
  如果有一天人类被AI取代，他们将以什么样的方式生活，娱乐，工作？
  国家网信办公开征求意见：汽车机构处理重要数据应提前报告。是否可实行？将产生什么影响？
  如何进行互联网金融运营数据的分析，都有哪些方法？
  如何看待 Alex Smola 加入 Amazon？
  如何评价贵州的大数据产业布局？会对贵州的经济发展产生什么影响？
  为什么说深度学习没有理论基础?
  机器学习中非均衡数据集的处理方法？
  国内外有哪些做小样本学习(Few-Shot Learning)的优秀团队？
  对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？
  是否有可能使用人工智能在高原、戈壁和沙漠中进行工业生产？
  计算商品embedding然后平均得到用户embedding，会不会存在这种问题？
  机器学习中的PR曲线一定会过（1，0）这个点吗？
  GAN:固定训练好的判别器网络，去指导训练生成器为什么不可以？
  机器学习，深度神经网络等方法是否是正确的方向？

© 2025-05-21 - tinynew.org. All Rights Reserved.
© 2025-05-21 - tinynew.org. 保留所有权利