腾讯研发全新TiG框架:可用AI玩王者荣耀让AI模型学会战略性思考
来源:
发布时间:2025-10-04 21:07:54
电竞资讯10月4日称 据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让AI在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 平台和 arXiv 期刊。
Qwen3-14B:决策准确率达 90.91%,超越 DeepSeek-R1 Qwen2.5-32B :准确率从 66.67% 提升至 86.84% Qwen2.5-14B:准确率从 53.25% 提升至 83.12%

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。
团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。
具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。
随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。
最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。
最终测试结果如下:
- 对照组 DeepSeek-R1:决策准确率达 86.67%
相关阅读
最新录像
10月05日法甲第7轮梅斯vs马赛全场录像
10-04
10月05日西甲第8轮赫罗纳vs瓦伦西亚全场录像
10-04
10月05日英超第7轮阿森纳vs西汉姆联全场录像
10-04
10月05日英超第7轮曼联vs桑德兰全场录像
10-04
10月05日德甲第6轮多特蒙德vsRB莱比锡全场录像
10-04
10月05日德甲第6轮勒沃库森vs柏林联合全场录像
10-04
10月05日德甲第6轮不莱梅vs圣保利全场录像
10-04
10月05日德甲第6轮奥格斯堡vs沃尔夫斯堡全场录像
10-04
10月05日意甲第6轮拉齐奥vs都灵全场录像
10-04
10月04日中乙保级组第28轮广州蒲公英vs上海海港B队全场录像
10-04
最新集锦
法甲奥莱利传射派尚建功马赛客场30梅斯联赛四连胜先赛登顶
10-04
西甲洛佩兹破门阿尔瑙马丁内斯建功十人赫罗纳21瓦伦西亚
10-04
德甲科穆尔传射费尔豪尔建功奥格斯堡31沃尔夫斯堡
10-04
德甲波库破门科法内建功勒沃库森20柏林联合联赛两连胜
10-04
德甲姆班古拉闪击不莱梅10圣保利终结联赛两连败
10-04
意甲索蒂尔破门制胜莱切客场10帕尔马取赛季首胜
10-04
浙江稠州银行杯职业篮球对抗赛广厦6465浙江全场集锦
10-04
中冠大连可为30南京铁虎河海于泽源、葛宇翔破门
10-04
中冠上海赛更达橘橙32大连涵瑀郑毅飞、张一破门
10-04
中冠青海昆仑20北京通州鹏瑞姜嘉豪梅开二度
10-04
热词推荐
热门TAG
-
图尔库国际
单独
竞选
缺点
马匹
华南
报名
哈尔科夫冶金1925
特赖巴赫
德文波特城
骗局
宝蓝
克里斯蒂安松
圣彼得堡泽尼特B队
吃水
叹息
TJ游击队卢贝拉
会见
照顾
跳马
乌姆阿法姆夏普尔
特拉维夫夏普尔
杜纳福尔德瓦
弗赖堡U19
纽伦堡
欧洲篮球直播
东方卫视高清
皇家社会VS曼彻斯特联直播
开拓者VS篮网直播
CCTV-1高清直播
狼队
中国女篮直播今晚篮球直播
江西卫视
羽毛球赛事直播
勒沃库森吧
山西篮球比赛直播
曼城vs阿斯顿维拉视频直播在线观看
曼联vs阿森纳足总杯直播在线观看
辽篮直播在线观看今日
雨燕在线直播体育直播
nba直播免费观看泡泡
nba无插件免费直播102
曼联利物浦双红会直播
泡泡网nba比赛直播
切尔西对维拉直播
kpl直播在线观看免费高清
cctv5在线直播湖人灰熊
曼联vs朴茨茅斯直播
曼城阿斯顿维拉直播
欧罗巴联赛免费直播