Policy Space Diversity for Non-Transitive Games

Yao, Jian; Liu, Weiming; Fu, Haobo; Yang, Yaodong; McAleer, Stephen; Fu, Qiang; Yang, Wei

Computer Science > Computer Science and Game Theory

arXiv:2306.16884 (cs)

[Submitted on 29 Jun 2023 (v1), last revised 8 Nov 2023 (this version, v2)]

Title:Policy Space Diversity for Non-Transitive Games

Authors:Jian Yao, Weiming Liu, Haobo Fu, Yaodong Yang, Stephen McAleer, Qiang Fu, Wei Yang

View PDF

Abstract:Policy-Space Response Oracles (PSRO) is an influential algorithm framework for approximating a Nash Equilibrium (NE) in multi-agent non-transitive games. Many previous studies have been trying to promote policy diversity in PSRO. A major weakness in existing diversity metrics is that a more diverse (according to their diversity metrics) population does not necessarily mean (as we proved in the paper) a better approximation to a NE. To alleviate this problem, we propose a new diversity metric, the improvement of which guarantees a better approximation to a NE. Meanwhile, we develop a practical and well-justified method to optimize our diversity metric using only state-action samples. By incorporating our diversity regularization into the best response solving in PSRO, we obtain a new PSRO variant, Policy Space Diversity PSRO (PSD-PSRO). We present the convergence property of PSD-PSRO. Empirically, extensive experiments on various games demonstrate that PSD-PSRO is more effective in producing significantly less exploitable policies than state-of-the-art PSRO variants.

Subjects:	Computer Science and Game Theory (cs.GT); Machine Learning (cs.LG); Multiagent Systems (cs.MA)
Cite as:	arXiv:2306.16884 [cs.GT]
	(or arXiv:2306.16884v2 [cs.GT] for this version)
	https://doi.org/10.48550/arXiv.2306.16884

Submission history

From: Jian Yao [view email]
[v1] Thu, 29 Jun 2023 12:07:30 UTC (4,938 KB)
[v2] Wed, 8 Nov 2023 10:53:30 UTC (5,709 KB)

Computer Science > Computer Science and Game Theory

Title:Policy Space Diversity for Non-Transitive Games

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Science and Game Theory

Title:Policy Space Diversity for Non-Transitive Games

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators