top | new | best | ask | show | jobs

top | item 44101770

Effective Reinforcement Learning for Reasoning in Language Models

4 points| obastani | 9 months ago |arxiv.org

discuss

order

No comments yet.

powered by hn/api // news.ycombinator.com