It's funny that 128B is now considered Medium. I remember back in the day when 355 M para...

minimaxir • yesterday at 4:27 PM • 1 reply • view on HN

It's funny that 128B is now considered Medium. I remember back in the day when 355M parameters was considered medium with GPT-2.

speedgoose • yesterday at 4:38 PM

And GPT-2 1.5B was considered too dangerous to release.

They were perhaps right.

➕ show 1 reply

alt Hacker News