百科问答小站 logo
百科问答小站 font logo



神经网络训练多个epoch,写论文的时候可以取最好的效果那一个epoch作为结果吗? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

见到paper实验里写的这种,无论他其他的部分写的多好,反正我看到了就会给打个strong reject。

因为这属于学术不端,本质上是information leaking,相当于在得到结果的时候预先使用了test set的信息。在你得到训练好的模型之前,你是不允许使用test set的任何信息的。(当然把test set accuracy 在代码里打印出来其实是可以的,但你要确保这个信息绝不参与对训练好的模型的选择)你都能在训练过程中找到”test set表现最好的那个epoch"了,这和直接把test set加入train set得到一个overfit的东西,有什么区别呢?

正确的做法是使用validation set上表现最好的那个epoch,放到test set上去看结果。


user avatar   ZhengPeng7 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  为什么交叉熵(cross-entropy)可以用于计算代价? 
  深度学习火热兴起后,隐马尔可夫模型(HMM)还有何独到之处,是不是几乎可被深度学习模型给替代了? 
  ICLR 2019 有什么值得关注的亮点? 
  用生成模型做数据增强data augmentation时,如何从合成数据中筛选出质量较好的样本? 
  深度学习在无人驾驶汽车上面的运用有哪些? 
  为什么说深度学习没有理论基础? 
  CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别? 
  从应用的角度来看,深度学习怎样快速入门? 
  如何看待Geoffrey Hinton的言论,深度学习要另起炉灶,彻底抛弃反向传播? 
  NLP文本匹配问题的本质是不是 对于要预测的句子,遍历候选句子 从训练数据集里寻找最相似的pair? 

前一个讨论
如何评价清华大学电子系大一暑假小学期总共 9 个学时的 Python 课程大作业难度?
下一个讨论
如何评价东奥决赛选手若因阳性弃权可获银牌,这规则你支持吗?





© 2024-07-03 - tinynew.org. All Rights Reserved.
© 2024-07-03 - tinynew.org. 保留所有权利