百科问答小站 logo
百科问答小站 font logo



反馈控制理论在优化、机器学习等领域有哪些应用? 第1页

  

user avatar   shuang-wu-8 网友的相关建议: 
      

算法收敛性的证明。


很多优化算法,以及机器学习算法都可以抽象成

或者如果数据带有噪音,再加入一个Martingale过程的扰动

前者是确定性动态系统,而后者是随机动态系统。算法的收敛就取决于寻找对应的李雅普诺夫函数了。


具体例子,比如TCP协议重的congestion control(堵塞控制)。congestion control的目标可以看作是受约束的用户utility maximization(效用最大化)。而congestion control的过程就可以看作是用算法寻找utility maximization的问题的最优点。


一篇比较新的paper:

A second order primal-dual method for nonsmooth convex composite optimization

以及比较早的

The O.D.E. Method for Convergence of Stochastic Approximation and Reinforcement Learning

Stability of primal–dual gradient dynamics and applications to network optimization




  

相关话题

  深度学习有哪些好玩的案例? 
  什么是人工智能?人工智能、机器学习、深度学习三者之间有什么关系吗? 
  为什么deep lab v3起,输出不再接 DenseCRF了? 
  学生网络用知识蒸馏损失去逼近教师网络,如何提高学生网络的准确率? 
  运维监控的KPI异常检测 业界有哪些实用方法? 
  机器学习在理论经济学研究中有哪些可能的应用前景? 
  f(x,y)->(x,y),是定义在一个2维空间开集上的 一一映射函数,f连续,它的象是否一定是开集? 
  谷歌翻译原理是什么,从语言A到B,中间是否要翻译成中介语言C(如英语)? 
  什么是博弈机器学习? 
  如何看待百度无人车, 三千多个场景,一万多个if? 

前一个讨论
波士顿和纽约的生活方式有什么不同?
下一个讨论
如何下载symbolic工具箱,在mathwork官网?





© 2025-04-01 - tinynew.org. All Rights Reserved.
© 2025-04-01 - tinynew.org. 保留所有权利