How great is the performance? Tokens/s?

bagels • 10/11/2024 • 1 reply • view on HN

Replies

yjftsjthsd-h • 10/12/2024

Random sample query ("What shape should a kumquat be?") against a 7B model quantised to 4b running on an i7-9750H (so a good CPU, but also a good laptop CPU from 2019) gives:

  148 tokens predicted, 159 ms per token, 6.27 tokens per second

➕ show 1 reply

alt Hacker News

Replies