Reinforcement Learning from Human Feedback: Progress and Challenges

A Distinguished Lecture by John Schulman from OpenAI on the Reinforcement Learning from Human Feedback (RLHF) work powering ChatGPT.

Event Date