Reinforcement Learning from Human Feedback (RLHF) in Notebooks

(github.com)

72 points | by ash_at_hny 3 days ago ago

3 comments

kcdom1000f 3 days ago
Hl
careful_ai 3 days ago
[dead]
bobvylan 3 days ago
[dead]