garrett4wade

Follow

Wei Fu garrett4wade

Follow

Ph.D. student in Tsinghua

85 followers · 11 following

Tsinghua University
Beijing, China

Achievements

Achievements

Pinned Loading

inclusionAI/AReaL inclusionAI/AReaL Public

Lightning-Fast RL for LLM Reasoning and Agents. Made Simple & Flexible.

Python 3.3k 264
openpsi-project/ReaLHF openpsi-project/ReaLHF Public archive

Super-Efficient RLHF Training of LLMs with Parameter Reallocation

Python 330 21
revisiting_marl revisiting_marl Public

Official codebase for paper "Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement Learning" (ICML22)

Python 23 1
cugae cugae Public

CUDA implementation of Generalized Advantage Estimation (GAE)

Python 4
scaling_marl scaling_marl Public

Python