神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？第1页

rewrgf 网友的相关建议:

见到paper实验里写的这种，无论他其他的部分写的多好，反正我看到了就会给打个strong reject。

因为这属于学术不端，本质上是information leaking，相当于在得到结果的时候预先使用了test set的信息。在你得到训练好的模型之前，你是不允许使用test set的任何信息的。（当然把test set accuracy 在代码里打印出来其实是可以的，但你要确保这个信息绝不参与对训练好的模型的选择）你都能在训练过程中找到”test set表现最好的那个epoch"了，这和直接把test set加入train set得到一个overfit的东西，有什么区别呢？

正确的做法是使用validation set上表现最好的那个epoch，放到test set上去看结果。

ZhengPeng7 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？的其他答案点击这里

相关话题

  神经网络中 warmup 策略为什么有效；有什么理论解释么？
  transformer 为什么使用 layer normalization，而不是其他的归一化方法？
  如果人工智能迎来下一个寒冬，你认为会是卡在什么问题上？
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？
  人工智能退潮期来了吗？
  batchsize=1时可以用BN吗?
  撰写 SCI 论文时，有什么好用的软件或者技巧吗？
  adversarial training为什么会起作用？
  三维重建怎么入门？
  SCI和核心期刊哪个难发？

神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？第1页