Yinmin Zhang | PAIR Lab: PKU Alignment and Interaction Research Lab

Yinmin Zhang | PAIR Lab: PKU Alignment and Interaction Research Labhttps://pair-lab.ai/author/yinmin-zhang/Yinmin ZhangHugo Blox Builder (https://hugoblox.com)en-usTue, 03 Dec 2024 00:00:00 +0000https://pair-lab.ai/media/icon_hu4f2a7092ab9dace538e8dee71ba34a1a_30036_512x512_fill_lanczos_center_3.pngYinmin Zhanghttps://pair-lab.ai/author/yinmin-zhang/Adaptive Pessimism via Target Q-Value for Offline Reinforcement Learninghttps://pair-lab.ai/publication/nn_2024/Tue, 03 Dec 2024 00:00:00 +0000https://pair-lab.ai/publication/nn_2024/A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learninghttps://pair-lab.ai/publication/aaai_2024_2/Wed, 06 Mar 2024 00:00:00 +0000https://pair-lab.ai/publication/aaai_2024_2/ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependencyhttps://pair-lab.ai/publication/aaai_2023_2/Tue, 29 Nov 2022 00:00:00 +0000https://pair-lab.ai/publication/aaai_2023_2/