Tensor parallelism is not useful on consumer platforms with slow interconnects, unless compute is re...

zozbot234 • yesterday at 10:10 PM • 0 replies • view on HN

Tensor parallelism is not useful on consumer platforms with slow interconnects, unless compute is really low and you prioritize decreasing latency over throughput. pipeline parallelism (and potentially expert parallelism) are more workable.

alt Hacker News