DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

2023-08-25 12:12
摘要:文章概要:1. 谷歌DeepMind开发了一个集成系统AZdb(AlphaZero Db),将多个AlphaZero代理组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。2.AZdb代理使用行为多样性和响应多样性,创造独特下棋风格,更好..

文章概要:

1. 谷歌DeepMind开发了一个集成系统AZdb(AlphaZero Db),将多个AlphaZero代理组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。

2.AZdb代理使用行为多样性和响应多样性,创造独特下棋风格,更好适应不同对手和新局面。

3. 测试显示,AZdb解决两倍难题,ELO评分提高50分,优于旧版AlphaZero。

谷歌DeepMind开发了一个集成系统AZdb,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。

DeepMind使用“行为多样性”和“响应多样性”技术,AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法,行为多样性最大化了AI系统之间平均棋子位置的差异,而响应多样性则使AI系统面临针对不同对手的游戏。在实践中,这也意味着 AZdb 的AI系统将看到更多不同的位置,扩大分布数据的范围,这应该允许系统更好地泛化到看不见的位置。

研究人员让AZdb与旧版AlphaZero下棋,结果显示AlphaZero Db的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。

这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。

AlphaZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。

更新于:2023-08-25 12:12