百科问答小站 logo
百科问答小站 font logo



为什么新增特征有时候会对模型带来负面影响? 第1页

  

user avatar   geng-rui-61 网友的相关建议: 
      

其实这个问题描述得不好。首先你的lr是什么lr,是logistic regression还是linear regression?没有加入什么贝叶斯、GP之类的?

因为不知道你说的是什么lr,所以不知道你处理的是什么问题,classification,还是regression。

你说的结果变差了,这个描述太不“统计学”了。如果你做的是regression,你是说MSE变大了,还是说l1或者l2变大了?你是如何做regularization的?如果你做的是classification,你说的结果变差了,是说accuracy差了,还是recall或者precision差了,或者只是f1差了?如果是f1差了,你是说minor f1差了还是major f1差了?

而且我们脱离数据谈数据也不好。数据本身是否做过standardisation?而且数据本身是否“可用”?我就见过有人把周一周二周三这种数值直接设为1、2、3、4、5、6、0,结果还问为什么效果变差了。而且有人连自己的数据的matrix的rank是多少都不知道,就直接撸模型。我说实话,这样是不合适的。你可能能做出结果,但是出了结果,你不知道怎么调。

而且你说排除过拟合,你是怎么排除这个可能性的?


所以说,我们常常看人做数据,手写算法,但是很少有人真的懂得科学的分析方法,很少有人真的能做error analysis。我是建议你重新编辑一下问题,然后大家帮你看一下。一般来说效果变差了,我的理解是,效果在training data和testing data上都变差了,而且无论训练多少个迭代,结果不收敛。那样的话,要检查你的数据本身是否可用。




  

相关话题

  如何评价微软亚洲研究院提出的LightRNN? 
  大四年级,完全没接触过高数,目前对机器学习产生浓厚兴趣,该如何学习数学? 
  去美国读CS博士,方向是机器人导航,视觉方面,推荐一下相关编程方面准备?还有相关算法需要学习哪些? 
  医学生学习机器学习该如何入门? 
  如何评价 DeepMind 在星际中的失利,以及 OpenAI 在 Dota 上的成功? 
  机器学习中的 Bias(偏差)、Error(误差)、Variance(方差)有什么区别和联系? 
  语音识别中,声学模型与语言模型扮演什么角色?或者说是怎么通过两个模型进行语音识别的? 
  机器学习最好的课程是什么? 
  如何看待AI伦理科学家Timnit Gebru在邮件控诉谷歌缺乏种族多样性后被Jeff Dean炒掉? 
  除了深度神经网络已经实现的特性以外,大脑还有哪些特性是值得机器学习领域借鉴的? 

前一个讨论
2021年,AI将何去何从?哪些技术与应用是下一个风口?能否推荐相关图书?
下一个讨论
如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)?





© 2025-05-10 - tinynew.org. All Rights Reserved.
© 2025-05-10 - tinynew.org. 保留所有权利