首页

强化学习和自适应控制的关系是什么？第1页

1

qiu-shui-20-54 网友的相关建议:

Father of RL, Richard Sutton早已给过答案：R. S. Sutton, A. G. Barto and R. J. Williams, "Reinforcement learning is direct adaptive optimal control," inIEEE Control Systems Magazine, vol. 12, no. 2, pp. 19-22, April 1992.

doi: 10.1109/37.126844

强化学习和自适应控制的关系是什么？的其他答案点击这里

1

相关话题

  机器人抓取时怎么定位的？用什么传感器来检测？
  多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢？
  据说机器学习长于预测，计量经济学长于解释。有什么具体例子是机器学习完成了很好的预测却在解释上表现不好？
  关于材料计算，模拟，仿真什么区别?
  如何理解 natural gradient descent?
  现代人工神经网络是不是一个死胡同？这个技术是不是骗人的？
  如何用最简单的语言统一描述多元函数求导（对向量求导、对矩阵求导等）？
  如何评价 DeepMind 新提出的关系网络（Relation Network）？
  如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文？
  多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢？

前一个讨论

怎么在simulink里面搭建如图所示的模块？

下一个讨论

matlab如何模块化编程？

相关的话题

  你见过哪些奇葩的控制算法？
  学习python中的pandas有没有好的教程推荐？
  有人说「真正的人工智能至少还要几百年才能实现」，真的是这样吗？
  在计算资源有限的情况下，有什么深度学习的选题可以推荐/避免？
  请问人工神经网络中的activation function的作用具体是什么？为什么ReLu要好过于tanh和sigmoid function?
  BERT模型可以使用无监督的方法做文本相似度任务吗？
  如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架，避免使用 TensorFlow？
  如何看待MXNet在CVPR2017上公布的gluon接口？
  在NLP当中，不同的评价指标，BLEU, METEOR, ROUGE和CIDEr的逻辑意义？
  想问下专业人士 OpenCv会被深度学习进一步取代吗进一步取代吗？
  在实际工程系统中，MPC太复杂，难以做到realtime。因此都利用数据，MPC对比RL还有优势么?
  多任务学习中loss多次backward和loss加和后backward有区别吗？
  有没有必要把机器学习算法自己实现一遍？
  机器人领域有哪些创业机会？又有哪些困难？
  机器人领域有哪些创业机会？又有哪些困难？
  对于多指标评价，BP神经网络评价和TOPSIS有什么区别呢？
  深度学习工作站中使用AMD的CPU会有问题吗？
  Linear least squares, Lasso,ridge regression有何本质区别？
  深度学习到底是「实验科学」还是「理论科学」？能否称为「算法」？
  搞机器学习的生环化材是天坑吗？
  如何理解今年发表在JMLR上随机森林算法SPORF？
  Deep Learning 的专家如此急缺，它难在何处？
  中国国产工业机器人怎么样?
  自监督学习（Self-supervised Learning）有什么比较新的思路？
  如何评价Hinton在加拿大多伦多大学关于用“capsule”作为下一代CNN的演讲？
  机器学习领域是否已经达到饱和？
  如何理解压缩感知(compressive sensing)？
  为什么在实际的kaggle比赛中，GBDT和Random Forest效果非常好？
  如何通俗的解释交叉熵与相对熵？
  如何评价生成模型框架 ZhuSuan?

© 2025-05-14 - tinynew.org. All Rights Reserved.
© 2025-05-14 - tinynew.org. 保留所有权利