Could these quantized models make MTP (Multi-Token Prediction) faster when used in conjunction with ...

somewhatrandom9 • today at 6:09 PM • 0 replies • view on HN

Could these quantized models make MTP (Multi-Token Prediction) faster when used in conjunction with larger Gemma 4 models?

alt Hacker News