大模型开始打王者荣耀了
腾讯AI玩转王者,小模型干翻大巨头,玩家操作要失业?
最近有个新发现,腾讯把大语言模型扔进《王者荣耀》里训练,居然能打出人一样水平。他们用一个叫TiG的框架,让只有140亿参数的Qwen-3-14B模型,在动作精准度上超过了6710亿参数的Deepseek-R1,这个差距挺大的。研究团队让模型自己玩游戏,边打边学,慢慢就掌握了战术。
这个框架把游戏里的英雄、地图、兵线这些信息变成文字,模型看懂后出主意,比如让阿古朵和姜子牙一起推塔。要是敌方埋伏就提醒小心,这些策略和真人玩家差不多。关键它不光会做动作,还能解释为啥这么做,这和之前那些只能乱按按钮的AI不一样。
训练的时候用了两步走,先让人教模型怎么分析局势,再让它自己实战练。刚开始模型连基本路线都选不对,但练了2000场之后,准确率涨到90%多。测试发现,给模型加了特殊算法后,连最大320亿参数的模型都能提升20个百分点。
游戏里的数据很关键,研究人员从真实对战里采样,把每个瞬间该做什么都标好。比如中路推塔的时候,系统会记录"联合队友进攻"这样的动作标签。要是同时出现多个任务,就挑最重要的那个标,保证模型不会乱。
奖励机制也简单,模型出的招数要是符合玩家习惯就算对,不对就0分。这样模型知道啥该做啥不该做,慢慢就形成了稳定策略。测试中发现,这种带解释的模型比单纯靠参数堆砌的模型更管用,可能因为它能学懂玩家真正的战术逻辑。
现在模型不仅能分析战局,还能提醒风险。比如看到敌方打野在野区晃悠,就会让射手别往前冲。这些提示都是根据地图情况实时生成的,和那些死板的攻略不同。
研究团队说以后可能让模型帮职业选手制定战术,或者当新手玩家的教练。不过现在还只是在游戏里测试,会不会影响比赛平衡还不知道。反正这次小模型打败大模型,说明AI的进步确实挺快。