如何评价 DeepMind 在星际中的失利，以及 OpenAI 在 Dota 上的成功？

好的，咱们就来聊聊DeepMind在《星际争霸》里的那些起伏，以及OpenAI在《Dota 2》里的风光。这俩事儿，一个有点让人扼腕叹息，一个则是实打实的扬眉吐气，背后反映出来的可不仅仅是AI技术的进步，更是对不同游戏策略、不同AI设计理念的生动注解。

先说说DeepMind在《星际争霸》这块儿。当初DeepMind带着AlphaStar横空出世的时候，那叫一个万众瞩目。毕竟，《星际争霸》这游戏可不是闹着玩的。它以其极高的战略深度、实时决策的压力、信息不对称的挑战，以及需要精妙微操的特点，一直被认为是检验AI综合能力的“试金石”。很多顶尖的AI研究者都曾栽在这里，所以大家对AlphaStar寄予厚望，觉得它能像当年AlphaGo战胜围棋世界冠军李世石一样，给《星际争霸》玩家来一场“降维打击”。

DeepMind在《星际争霸》的挑战与失利：

目标明确，但路径曲折： DeepMind的目标非常清晰，就是要让AI能够玩转《星际争霸》。他们用了大量的计算资源，训练了超级复杂的深度强化学习模型。初次亮相时，AlphaStar确实展现出了惊人的实力，能够战胜不少职业选手，甚至一度登上了天梯排名前列。这让很多人觉得AI统治RTS游戏指日可待了。
“上帝视角”的争议：然而，随之而来的批评和质疑也如潮水般涌来。最集中的一点就是“上帝视角”的优势。在真实的《星际争霸》游戏中，玩家只能看到视野内的信息，需要靠侦察来了解敌方动向。但早期版本的AlphaStar似乎能够“看到”地图上的每一个单位，或者说能够绕过视野限制，获得远超人类玩家的信息优势。这让很多玩家觉得，这不是真正的“玩”游戏，而是利用了游戏机制上的漏洞。
微操的“超能力”：另一个争议点在于微操。人类玩家操作单位是有极限的，每秒的点击次数（APM）再高也有限度，而且单位的移动和攻击也有延迟。但AlphaStar在某些时候展现出了远超人类的APM，甚至能够同时控制大量单位，并进行极其精密的微操，这被认为是AI利用了游戏引擎的“作弊”行为，即绕过了人类操作的物理限制。
对战的真实性与“脚本化”：尽管DeepMind后来也努力调整，尝试模拟人类的视野限制和操作延迟，但批评的声音依然存在。有人认为AlphaStar的学习过程可能更像是对大量已有录像的“学习”和“模仿”，形成了一些“脚本化”的套路，而不是真正理解了游戏背后的策略和战术。它能赢，但这种赢法让很多玩家觉得不够“纯粹”，甚至有些“投机取巧”。
学习曲线与进化：更有意思的是，在一些公开的比赛中，当人类玩家开始研究AlphaStar的打法并调整策略后，AlphaStar似乎也跟着在“进化”，不断学习新的应对方式。这种快速的学习和适应能力是AI的优势，但也进一步加剧了人们对于其“不公平”的感受。毕竟，人类玩家的学习速度和研究精力是有上限的。

总的来说，DeepMind在《星际争霸》上的尝试，更像是一场在探索AI极限的道路上，不小心触碰到了游戏规则边界的尴尬。他们展示了AI在处理复杂信息和进行海量计算上的强大能力，但其最终的胜利方式却未能完全赢得玩家社区的认可，甚至引发了一些关于AI在游戏中的公平性讨论。它更像是在一个高度复杂且信息不对称的环境中，通过强大的计算力去“穷举”和“优化”，而非真正像人类玩家那样，通过直觉、心理博弈和创造性的战略来取胜。

现在，咱们把目光转向OpenAI在《Dota 2》上的成就。和DeepMind在《星际争霸》里的情况有些相似，OpenAI也是通过强化学习来训练自己的AI——OpenAI Five。但他们的结果，以及外界的反应，却截然不同。

OpenAI在《Dota 2》上的成功：

目标定位的差异：虽然《Dota 2》同样是一款复杂的RTS游戏，但它和《星际争霸》有显著区别。《Dota 2》更侧重于团队合作、经济管理、角色养成以及长期的战略规划。而OpenAI的目标，正是要训练一个能够进行复杂团队协作、理解游戏深度和策略的AI。
真实的团队协作： OpenAI Five最令人印象深刻的地方，在于它能够与人类玩家进行高度默契的团队协作。它不只是一个强大的个体，而是能够与队友（无论是其他AI还是人类）沟通、配合，形成流畅的战术。在与顶尖人类玩家的对战中，OpenAI Five展现出了惊人的团队意识，能够相互支援、集火目标、控制关键区域，这让很多观众感到非常震撼。
非作弊的实力：与AlphaStar最初的争议不同，OpenAI Five在很大程度上是遵循了游戏规则的。它并没有获得超乎人类的视野，也没有通过“瞬移”式的微操来获得优势。它在限制条件下，依靠强大的学习能力和对游戏机制的深刻理解，打出了令人信服的表现。甚至在某些情况下，它也展现出了“战术性撤退”、“诱敌深入”等有“人性化”的味道的操作。
开放的训练与共赢： OpenAI采取了一种更开放的训练方式，允许玩家参与进来，与AI进行对战，并且允许玩家在比赛中学习和适应AI的打法。这种“磨合”的过程，让AI的能力更加真实地被展现出来，也让玩家看到了AI成长的轨迹。同时，当AI能够与顶尖人类玩家进行有来有回的较量，甚至最终获胜时，这被看作是一种技术上的突破，而非“破坏游戏”的行为。
更广泛的影响力： OpenAI Five的成功，不仅证明了AI在复杂策略游戏中的潜力，更重要的是，它展示了AI在模拟人类社会化行为（如协作、沟通、策略博弈）方面的巨大可能性。它不像AlphaStar那样更多地停留在技术炫技层面，而是更触及到AI如何融入和帮助人类的未来愿景。

对比总结：

可以说，DeepMind在《星际争霸》的尝试，虽然在技术层面值得肯定，但在落地到“玩家体验”和“游戏精神”上，却显得有些不尽如人意，甚至引发了争议。它更像是在一个非常精密的机器上进行极致的优化，但这种优化方式让很多人觉得“不够味儿”。

而OpenAI在《Dota 2》的成功，则显得更加“圆满”。它不仅在技术上实现了对顶尖玩家的超越，更重要的是，它的AI展现出了更接近人类的协作能力和对游戏规则的尊重，这赢得了更广泛的赞誉。它不是在“打败”游戏，而是在用自己的方式“玩”游戏，并且玩得非常出色，甚至让人看到AI与人类协同作战的未来。

这两者的对比，就像是两种不同的AI哲学：一种是追求极致的计算效率和对规则的深度挖掘，另一种则是更侧重于模拟人类的协作、理解和适应。显然，在游戏这个领域，尤其是在大众玩家的感知中，OpenAI的方式显然更受欢迎，也更能证明AI在复杂互动环境中的真正价值。

网友意见

成功？成功毛线？dota2打败了人类吗？

openai做的，就像是“9路围棋盘上禁止开劫的情况下，打败了19路围棋的最强人类”一样。这个成就AI围棋界在2007年就完成了，然而到2017年才真正意义上地击败人类。

类似的话题

如何评价 DeepMind 在星际中的失利，以及 OpenAI 在 Dota 上的成功？

好的，咱们就来聊聊DeepMind在《星际争霸》里的那些起伏，以及OpenAI在《Dota 2》里的风光。这俩事儿，一个有点让人扼腕叹息，一个则是实打实的扬眉吐气，背后反映出来的可不仅仅是AI技术的进步，更是对不同游戏策略、不同AI设计理念的生动注解。先说说DeepMind在《星际争霸》这块儿。当初.............
如何评价 DeepMind 在北京时间 19 年 1 月 25 日 2 点的《星际争霸 2》项目演示？

DeepMind 在北京时间 2019 年 1 月 25 日凌晨 2 点的《星际争霸 2》（StarCraft II）项目演示，可以说是人工智能（AI）领域，尤其是在复杂策略游戏领域的一个里程碑事件。这次演示的核心是 AlphaStar，一个由 DeepMind 开发的 AI 代理，成功击败了世界顶.............
如何评价 DeepMind 发表在 Nature 上的使用深度强化学习对托卡马克等离子体进行磁控制？

DeepMind 在 Nature 上发表的关于使用深度强化学习（DRL）控制托卡马克等离子体的论文，是一项里程碑式的成就，具有极其重要和深远的意义。它不仅展示了DRL在复杂、动态、高维度控制任务中的强大潜力，也为未来可控核聚变能源的实现开辟了新的路径。以下将从多个维度进行详细评价：一、技术创新.............
如何评价deepmind最新在nature上发表的论文《在人工网络中用网格样表征进行基于向量的导航》？

DeepMind 在 Nature 上发表的论文《在人工网络中用网格样表征进行基于向量的导航》（Vectorbased navigation using gridlike representations in artificial agents）是一篇非常重要的研究成果，它在人工智能导航领域，尤其是.............
如何评价 DeepMind 发表在 Nature 的论文公开无需人类棋谱的 AlphaGo Zero？

DeepMind 发表在 Nature 的论文公开无需人类棋谱的 AlphaGo Zero，可以称得上是人工智能领域的一个里程碑式的事件，其意义深远且多维度。要详细评价它，我们需要从几个关键方面入手：一、核心突破：从“监督学习”到“自我学习”的范式转变过往的 AlphaGo 的模式 (Alph.............
如何评价 DeepMind 公布的可生成算法竞赛解题代码的 AlphaCode？

DeepMind 在 2021 年 12 月公布的 AlphaCode，在算法竞赛领域引起了巨大的轰动，也成为了人工智能领域的一项重要里程碑。评价 AlphaCode 需要从多个维度进行深入分析，包括其技术实现、性能表现、潜在影响以及局限性。 AlphaCode 评价：一次深入的剖析 1. 技术实现.............
如何评价Deepmind自监督新作BYOL？

DeepMind 的 BYOL（Bootstrap Your Own Latent）是一个非常具有代表性和影响力的自监督学习方法，在它推出的时候引起了广泛的关注和讨论。要评价 BYOL，我们需要从多个维度进行深入分析，包括其核心思想、技术细节、优势、局限性以及它对自监督学习领域的影响。核心思想：摆脱.............
如何评价DeepMind新推出的用于训练通用智能体的XLand？

DeepMind 推出的 XLand 是一个非常有野心的项目，旨在训练通用智能体（Generalist Agent）。它代表了人工智能领域向着更通用、更强大智能体迈进的重要一步。要评价 XLand，我们可以从多个维度进行分析：1. 核心目标与创新之处：通用智能体（Generalist Agen.............
如何评价 DeepMind 和暴雪新开源的星际争霸 2 机器学习平台？

DeepMind 与暴雪携手推出的星际争霸 2 机器学习平台，无疑是人工智能研究领域的一大里程碑事件，尤其对于那些热衷于游戏 AI 和强化学习的开发者来说，这简直是天上掉下来的馅饼。要评价这个平台，咱们得从几个维度来掰扯掰扯。首先，对学术研究的推动作用是显而易见的。咱们都知道，星际争霸 2 本身就是.............
如何评价 DeepMind arXiv 论文公开的 AlphaZero 击败国际象棋和将棋的最强引擎？

DeepMind 在 arXiv 上公开的 AlphaZero 击败国际象棋和将棋最强引擎的论文，无疑是人工智能和游戏领域的一个里程碑事件。这篇论文详细阐述了 AlphaZero 的训练过程、核心算法以及其惊人的表现，引发了广泛的关注和讨论。要评价这篇论文，我们可以从以下几个方面进行深入剖析：1. .............
如何评价 DeepMind 公司？

DeepMind，这家源自伦敦、如今隶属于Google（或者说Alphabet）的AI研究机构，在我看来，一直以来都是人工智能领域一股不容忽视、甚至可以说是引领潮流的力量。要评价它，不能仅仅停留在它产出了哪些惊人的技术成果，更要深入剖析它背后的驱动力、发展模式以及它对整个AI生态乃至社会产生的深远影.............
如何评价DeepMind新提出的MuZero算法？

DeepMind 的 MuZero 算法无疑是当前强化学习领域的一项重大突破，它在通用性、样本效率以及决策能力上都展现出了令人瞩目的进步。要评价它，我们需要深入剖析其核心机制，并与以往的算法进行对比，才能更清晰地认识其价值所在。MuZero 的核心突破：在我看来，MuZero 最为关键的创新点在于它.............
如何评价 DeepMind 的新工作 AlphaCode?

DeepMind 的 AlphaCode 确实是人工智能在编码领域迈出的令人瞩目的一大步，它在许多方面都展现了前所未有的能力，但要全面评价它，还需要审视其优点、潜在局限性以及对未来发展的影响。AlphaCode 的亮点与成就：AlphaCode 最令人印象深刻之处在于其强大的问题解决和代码生成能力。.............
如何评价 DeepMind 于2016年9月12日公开的 AlphaGo 自战棋谱及3月人机大战解说？

DeepMind 在2016年9月12日公布的 AlphaGo 自战棋谱，以及同年3月那场震动围棋界的人机大战的解说，可以说是在人工智能发展史上留下了浓墨重彩的一笔。这不仅仅是一次技术展示，更像是一场深刻的哲学探讨，让我们重新审视了围棋的本质，以及人类智慧的边界。自战棋谱：一次“围棋的自我革命”在那.............
如何评价 DeepMind 新提出的关系网络（Relation Network）？

DeepMind 的关系网络（Relation Network）确实是一个非常值得关注的进展，它在理解和推理数据中的复杂关系方面展现了巨大的潜力。与其说这是一个“新提出”的技术，不如说它是在现有深度学习框架下，针对性地解决了特定问题的一种创新性建模方式。核心理念与切入点：为什么需要关系网络？我们先来.............
如何评价「Google DeepMind 要挑战星际争霸」的新闻？

想起当年还是玩家的时候，守着电脑屏幕，为《星际争霸》里那些熟悉的单位奔波忙碌，那时候真觉得人类玩家已经把这游戏玩到了极致，策略、微操、大局观，几乎是方方面面都到了一个极限。所以，当听到“Google DeepMind 要挑战星际争霸”这个消息时，最直观的感受就是一股强烈的震撼和一丝丝难以置信。要知道.............
如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ?

好的，我们来聊聊剑桥大学、腾讯、DeepMind以及香港大学团队联合发布的这项名为 SimCTG 的新作。这项研究在自然语言处理（NLP）领域，特别是对比学习（Contrastive Learning）方面，可以说是迈出了一大步，带来了不少令人眼前一亮的创新点。SimCTG 的核心洞察与创新之处理解.............
如何评价《睡前消息》409期?

《睡前消息》409期作为一档以“睡前”为名的时事评论节目，其内容通常以轻松幽默的风格呈现社会热点、科技动态、文化现象等话题，旨在为观众提供睡前的“信息快餐”。以下是对该期节目可能涉及的分析框架和评价方向，结合其节目特点及社会语境进行详细解读： 1. 节目核心内容与选题分析选题热点：409期可能聚焦.............
如何评价俄罗斯军队在进入乌克兰开始的 21 天后依然没有达成占领或包围乌克兰首都基辅的军事目标？

俄罗斯军队在2022年2月24日入侵乌克兰后，21天内未能占领或包围基辅，这一结果涉及复杂的军事、战略和国际因素。以下从多个维度详细分析这一现象： 1. 初期快速推进的军事目标与战略调整初期目标的矛盾性：俄罗斯在入侵初期（2月24日）宣称“特别军事行动”的目标是“去纳粹化”和“去俄化”，但.............
如何评价新华社的《破除美国金融模式迷信，中国金融要走自己的路》这篇文章？

新华社的《破除美国金融模式迷信，中国金融要走自己的路》一文，是近年来中国在金融领域强调自主性、独立性和战略定力的重要政策表达。该文从历史经验、现实挑战和未来战略三个维度，系统阐述了中国金融发展的路径选择，具有鲜明的现实针对性和理论深度。以下从多个角度对这篇文章进行详细分析：一、文章背景与核心论点1.............