zhongdenny's recent timeline updates
zhongdenny

zhongdenny

V2EX member #197175, joined on 2016-10-19 23:59:59 +08:00
zhongdenny's recent replies
Feb 8, 2025
Replied to a topic by mingtdlb Local LLM LLM 私有化部署
@mingtdlb ollama 的默认 671b ,400G 大小,好像写着是 4 比特量化版本。官方版本 163 个 4G 的文件,合计大概 700G 。
@nagisaushio 你是用 ollama 还是 llama.cpp 来运行的?
我用了 2.22bit 的版本,llama.cpp ,8 卡 4090 ,跑到 3 token/s 。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2466 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 11:05 · PVG 19:05 · LAX 04:05 · JFK 07:05
♥ Do have faith in what you're doing.