Is it worth running speculative decoding on small active models like this? Or does MTP make speculat...

syntaxing • today at 5:07 PM • 0 replies • view on HN

Is it worth running speculative decoding on small active models like this? Or does MTP make speculative decoding unnecessary?

alt Hacker News