转载

OpenAI研究 具有大规模深度强化学习的 Dota 2

2019 年 4 月 13 日,OpenAI Five 成为第一个在电子竞技比赛中击败世界冠军的人工智能系统。Dota 2 游戏为 AI 系统提出了新的挑战,例如长时间视野、不完美的信息以及复杂、连续的状态动作空间,所有这些挑战将成为更强大的 AI 系统的核心。OpenAI Five 利用现有的强化学习技术,每 2 秒从大约 200 万帧的批次中学习。我们开发了一个分布式训练系统和持续训练工具,使我们能够训练 OpenAI Five 10 个月。通过击败 Dota 2 世界冠军(Team OG),OpenAI Five 证明了自我对弈强化学习可以在一项艰巨的任务中取得超人的表现。

详细论文