Representation Learning

TIMAR: Transition-Informed Representation for Sample-Efficient Multi-agent Reinforcement Learning

In MARL (Multi-Agent Reinforcement Learning), the trial-and-error learning paradigm based on multiple agents requires massive …

Mingxiao Feng, Yaodong Yang, Wengang Zhou, Houqiang Li

Adaptive Pessimism via Target Q-Value for Offline Reinforcement Learning

Offline reinforcement learning (RL) methods learn from datasets without further environment interaction, facing errors due to …

Jie Liu, Yinmin Zhang, Chuming Li, Yaodong Yang, Yu Liu, Wanli Ouyang