Yes, absolutely in deep learning. Custom fused CUDA kernels everywhere. | alt Hacker News

alt Hacker News

qeternity • yesterday at 10:58 PM • 1 reply • view on HN

Yes, absolutely in deep learning. Custom fused CUDA kernels everywhere.

Replies

Scene_Cast2 • today at 12:28 AM

Yep. MoE, FlashAttention, or sparse retrieval architectures for example.