How does post-training via reinforcement learning factor in? Does every evaluated judgement count as...

half-kh-hacker • today at 6:29 AM • 2 replies • view on HN

How does post-training via reinforcement learning factor in? Does every evaluated judgement count as 'the training data' ?

abcde666777 • today at 7:08 AM

I guess I'd place both within a broader umbrella: human generated input. So it still holds that they're regurgitating the decisions made by humans.

internet_points • today at 8:50 AM

yes

alt Hacker News