Internal evals, Big AI certainly has good, proprietary training and eval data, it's one reason ...

verdverm • yesterday at 6:51 PM • 1 reply • view on HN

Internal evals, Big AI certainly has good, proprietary training and eval data, it's one reason why their models are better

aydyn • yesterday at 6:58 PM

Then publish the results of those internal evals. Public benchmark saturation isn't an excuse to be un-quantitative.

➕ show 1 reply

alt Hacker News