8090要玩网手游攻略新游动态为什么最先进的AI型号挑战《宝可梦》？

为什么最先进的AI型号挑战《宝可梦》？

时间：2025 07 20 21:18:34 来源：互联网浏览：0

这篇文章给大家聊聊关于为什么最先进的AI型号挑战《宝可梦》？，以及对应的知识点，希望对各位有所帮助，不要忘了收藏本站哦。

当各种AI模型首次出现时，总是有一种“表现肌肉”的可靠方法，这是为了让他们的AI独立玩某个游戏以测试模型的智能。

自GO球员Lee Sedol和Alphago举行的五场比赛以来，已经过去了将近十年。然后，无论是Google的DeepMind在《DOTA2》上击败了人类专业球员《星际争霸2》，还是NVIDIA宣布了可以在2023年进行《我的世界》的Voyager的开发，它不断证明“游戏”似乎是AI的自然测试站点。

每个人都应该能够感觉到AI技术在过去十年中发展迅速。当时的大型语言模型与当时的Alphago具有截然不同的培训方法和决策过程。但是，已经过去了十年，无论是一家想要展示研究结果的技术公司还是吸引不了解技术细节的普通百姓的注意，“让AI玩游戏”仍然是一种非常普遍的方法。

最近，Google的AI Model Gemini 2.5 Pro再次成为AI领域的热门话题，因为它已经获得了“独立的海关清除第一代《宝可梦》”。 Google现任首席执行官Sundar Pichai和DeepMind负责人Demis Hassabis甚至发布了推文来庆祝这一刻。

但是如前所述，在2025年，让AI玩游戏并通过该水平不再是一个新话题。更重要的是，1995年发行的第一代神奇宝贝以其高难度和复杂性而闻名。始终主要是休闲和放松的神奇宝贝系列可以在很短的时间内迅速开始，并且通过水平并不困难。

那为什么要获得AI清除《宝可梦》是一件大事呢？

Moravec的悖论是在1980年代提出的，曾经提到过一种违反直觉的观点：人类认为容易做的任务实际上对人工智能而言更加困难，反之亦然。

提出这个悖论的学者摩拉维克曾经为他写了一个直观的解释：“像成年人一样使计算机下棋相对容易，但是有能力能够感知并像一岁的孩子一样困难，甚至不可能。”

对于此AI Gemini经过《宝可梦》，它与让AI具有自己的感知和动作能力更相似。

对于AI，“独立清除第一代《宝可梦》”是一个比人类想象的要复杂得多的挑战。

早在今年2月，另一家美国人工智能技术公司Anthropic宣布了一个名为“ Claude扮演Pokmon”的技术实验。实验内容与其名称相同，试图让公司最新版本的AI Claude 3.7十四行诗体验第一代PokmonGames，并使用“通过Level Game”作为实验的最终目标。

实验以失败结束。克劳德3.7的最终进展是挑战三个体育馆并获得三个徽章，但即使是人类球员的这一琐碎成就也是克劳德多年来迭代的结果。

根据Anthropic发布的信息，一年前Claude的3.0版本甚至无法摆脱游戏的原始“真正的新城镇”。随后的3.5版本略有改进，行程介绍了“ Changpan Forest”，但仍然无法获得第一个徽章。

进步缓慢的原因无非是：克劳德（Claude）的决策将长期思考，重复城镇并毫无意义，长期陷入地图的死角，或反复与无助的Passerby NPC交谈。

克劳德（Claude）的海关清除过程也向公众现场直播

这些行为似乎是“人工智能的停滞”，远低于Alphago，它在诸如GO或《星际争霸》之类的战略游戏中打败了人类玩家，但这实际上是两者的训练方法的差异。

对于过去几年中《DOTA2》在GO等项目中表现良好的AI，开发人员通常会为算法提供有关游戏规则和策略的基本信息，并设置奖励功能，从而为AI的正确动作提供积极的回报。这是经常提到的“强化学*”。

但是，对于基于Claude和Gemini等大型语言模型的AI，它并不是针对特定游戏的。研究人员没有提供《宝可梦》独家游戏规则或目标说明，也没有进行特定的培训，而是直接让一般的Claude模型运行游戏。

这与允许纯粹的新手不愿意通过自己的看法和学*逐渐掌握游戏过程。

此外，当克劳德（Claude）玩游戏时，信息的频道不是内部代码，而是像人类一样，所有内容只能从游戏屏幕上获得。克劳德（Claude）的早期版本经常撞到墙壁，因为与现代游戏相比，AI很难识别由像素组成的这些抽象图片，这对人类玩家来说非常容易。

AI需要为图片中的每个坐标点标记信息，并且红色被视为无法通过的区域。

相反，神奇宝贝更复杂的属性约束系统非常容易理解。例如，当游戏提示电动属性技能对岩石型神奇宝贝具有“平均效果”时，克劳德迅速捕获了这一关键信息，并将其应用于随后的团队成立策略。

为什么研究人员可以确保AI确实了解“属性约束”？由于当前的大型语言模型，可以同时向外界展示完整的思维过程。

当克劳德（Claude）扮演神奇宝贝（Pokmon）时，左侧将同步每个操作的决策过程。

这也是该项目试图探索的影响。如上图所示，克劳德（Claude）全面分析了他使用比比鸟（Bibi Bird）与电动磁力抗衡时所掌握的四个技能：

“诸如机翼攻击之类的飞行动作对电动神奇宝贝不是很有效。”

“阵风和闪电闪烁之类的Twitter只会造成中等的伤害。”

“舒沙只会降低命中率，不会造成直接损害。”

最终，克劳德总结了：

“由于Bibi在属性方面处于不利状态，因此我应该尽快击败Magneto。我的最佳选择可能是机翼攻击，这是我最强大的举动，尽管它运作良好，但它做得很好。让我向下按“三次”，“确定”以选择机翼攻击。”

尽管我们所展示的内容仍然是相对较浅的思考，但与阿尔法戈（Alphago）纯粹的“黑匣子”决策过程相比，克劳德（Claude）和其他具有较大语言模型的AI毫无疑问，毫无疑问是在实用上迈出了重要一步。

您应该知道，在早期GO领域，关于Alphago的最令人印象深刻的事情是，它总是可以发挥“主动”，这使得人类很难理解但最终获胜。不幸的是，通过“加强学*”训练的Alphago很难用自然语言向人类介绍决策过程。否则，人类的国际象棋参与者可能会受到AI逻辑的进一步启发。

对于扮演神奇宝贝的克劳德（Claude）来说，尽管没有什么能使人类在战略层面上发光，但在展示了思维过程之后，它显示了一些“意外”的思维逻辑。

例如，在下面的场景中，当克劳德（Claude）迷失在游戏的“月光山”地图上，并认为他无法通过正常手段从山洞中脱颖而出时，AI做出了一种非常“人性化的”思维方式：

“我现在的最佳选择是故意失去一场战斗，以便将我上次访问的神奇宝贝中心（Moon-SaturdayPokmonCenter in 4 Road 4 Road Road 4号）被传送到我以前已验证到Hualan City的道路。”

例如，AI还将具有“承认对NPC的错误”的现象。在游戏的早期阶段，克劳德（Claude）被要求找到NPC“ Oki博士”，但游戏没有提供明确的指导，也没有解释NPC的特定位置和外观特征。实际上，AI实现了这个“模糊目标”，实际上更加困难。

收到这项任务后，克劳德（Claude）也做出了一个非常拟人化的想法：“我注意到一个新角色——在坐标的黑发，白色的涂层角色下面（2，10），这可能是oki博士！让我失望，与他交谈。”

然后，它与NPC进行了几次与主线无关的NPC，最后意识到这不是他正在寻找的Oki博士。

几天前通过游戏版本相同版本的AI Gemini之所以引起关注，这不仅是因为它可以完成游戏而不提供人类的任何规则信息，而且还可以按照官方统计数据的规定，Gemini的总数步骤的总数约为106,000，大约是106,000，甚至比Claaude获得第三次BADGE时达到的215,000个步骤的一半。

双子座通过了第一代神奇宝贝

这似乎表明双子座的智力水平比克劳德（Claude）更好，但是负责双子座项目的研究人员乔尔兹（Joelz）表示，不可能直接比较两个AIS，因为这不是完全相同的条件下的测试。

不同之处在于，代理线束，即“代理执行框架”，用于连接AI模型和游戏，负责处理输入信息，例如游戏屏幕，文本数据等，并将模型决策转换为关键命令和其他操作。

根据官方信息，双子座的代理执行框架确实比克劳德更好。例如，在对地图的分析中，它不仅标记了每个区域的坐标，而且还表示坐标的可传递状态。这为不擅长直接分析像素图像的大型语言模型提供了很好的帮助：

但是，正如开发人员本人所说的那样，让AI玩神奇宝贝并不是比较不同AI的水平的含义。

像《宝可梦》这样的游戏要求AI以长期的方式感知环境，了解模糊目标和计划行动。它必须不断接收游戏图像，了解不同阶段的规则，然后将决策转换为游戏操作。我们痴迷于让AI操作游戏的原因是，如果AI可以在不干预的情况下通过水平，这也表明它有可能独立学*并解决现实中的某些复杂问题。

用户评论

枫无痕

我一直觉得这跟游戏本身有关系吧！《宝可梦》这个IP不仅内容吸引人，还有庞大的玩家群体和活跃社区，对AI大模型来说是一个很好的测试平台。而且很多玩家也很乐于分享他们的创意和玩法，为模型的训练提供便利。

有15位网友表示赞同！

把孤独喂饱

《宝可梦》里的世界观和规则简单易懂，对于 AI 来说容易理解和学*，我也觉得挑战《宝可梦》能更好地展现AI的能力，毕竟不是所有人都有时间沉迷游戏还能玩得精通，所以用 AI 来“训练”或许是更有效的途径。

有10位网友表示赞同！

不离我

说实话我有点困惑啊，为什么这么多先锋型的 AI 大模型都扎堆去挑战《宝可梦》，難道这不是把资源浪费到极致了吗？有那么多其他更有意义的任务呢！比如医疗、教育、科学研究等等...

有8位网友表示赞同！

命运不堪浮华

也许是《宝可梦》的训练和战斗机制本身具有很强的算法逻辑性， AI 进行模拟更能体现出自身的学*能力和策略思维。毕竟，一个优秀的AI需要不仅具备计算能力，还需要能够做出合理决策并执行策略。

有7位网友表示赞同！

强辩

我觉得这很有趣！看看这些 AI 大模型能不能创造出一些新的游戏玩法，或者战胜人类玩家，也对未来的人工智能发展有一个更好的了解。

有7位网友表示赞同！

遗憾最汹涌

挑战《宝可梦》只是一个手段而已，其实更重要的是观察AI在学*、策略、决策等方面的表现。这些都是未来人工智能发展的关键方向呀！

有7位网友表示赞同！

咆哮

这完全是把“智能”给定义错了，难道这些开发者没别的更有意思的任务吗？还是说他们的目标只是玩这个游戏，而不是用技术推动真正的科学进步？

有11位网友表示赞同！

哭花了素颜

我挺希望看到 AI 能战胜人类玩家的，那会是个让人震惊的结果啊！当然我也期待这些 AI 大模型能够更广泛地应用于其他领域，比如医疗、环保等等...

有9位网友表示赞同！

慑人的傲气

我觉得这可能是未来互联网游戏的一种发展方向了。AI 可以成为伙伴或者对手，让游戏体验更加丰富多元化.

有9位网友表示赞同！

别在我面前犯贱

我对这种挑战《宝可梦》的项目感觉有点云里雾里的，不知道他们具体在想做什么？

有12位网友表示赞同！

秒淘你心窝

总觉得这些 AI 大模型还太过于局限于游戏的范畴，应该更多地关注现实世界的应用和解决实际问题才是最重要的呀！

有9位网友表示赞同！

伤离别

我小时候就对《宝可梦》爱不释手，现在竟然看到 AI 来挑战它了，真是时代变了！虽然我不太明白他们做的目标是什么...

有8位网友表示赞同！

〆mè村姑

我觉得这个项目挺有意思的，可以从另一个角度来观察和理解人工智能的发展方向。毕竟，《宝可梦》里蕴含着许多关于策略、战斗和团队合作的元素...

有5位网友表示赞同！

我家的爱豆是怪比i

不知道这些 AI 大模型会不会开发出一些新的训练方法或者进化技巧？期待看到他们带来更加精彩的游戏体验！

有19位网友表示赞同！

惯例

我觉得这种做法有点浪费时间和资源啊，专注于更实际更有意义的研究才是最重要的！

有20位网友表示赞同！

心贝

我挺好奇看看这些 AI 大模型能不能最终创造出一套完全不同的游戏玩法，从而颠覆传统的《宝可梦》的游戏模式...

有16位网友表示赞同！

♂你那刺眼的温柔

也许挑战《宝可梦》只是这些AI大模型“入门训练”的过程，未来的更高目标可能是突破游戏的界限，创造出真正新的游戏世界。

有7位网友表示赞同！

海盟山誓总是赊

总觉得有些夸张了，把AI大模型和游戏的结合说得那么神化，就看他们能做出什么更实际、更有意义的功能吧！

有13位网友表示赞同！

自繩自縛

真的很有意思啊！可以看出开发者们都在尝试将人工智能技术应用到各个领域，甚至是在娱乐方面...