To be fair, it's "possible" to run such setup with llama.cpp with ssd offload. It...

3abiton • yesterday at 9:18 PM • 0 replies • view on HN

To be fair, it's "possible" to run such setup with llama.cpp with ssd offload. It's just abysmal TG speeds. But it's possible.

alt Hacker News