Home
Sign Up
Sign In
zhongdenny's recent timeline updates
zhongdenny
V2EX member #197175, joined on 2016-10-19 23:59:59 +08:00
zhongdenny
提问
技术话题
好玩
工作信息
交易信息
城市相关
zhongdenny's recent replies
Feb 8, 2025
Replied to a topic by
mingtdlb
›
Local LLM
›
LLM 私有化部署
@
mingtdlb
ollama 的默认 671b ,400G 大小,好像写着是 4 比特量化版本。官方版本 163 个 4G 的文件,合计大概 700G 。
Feb 8, 2025
Replied to a topic by
2067
›
Local LLM
›
有没有富哥实际部署了 671b 完全体 R1 的来说说跟 llama3.1:405b 的性能有多大进化
@
nagisaushio
你是用 ollama 还是 llama.cpp 来运行的?
我用了 2.22bit 的版本,llama.cpp ,8 卡 4090 ,跑到 3 token/s 。
»
More replies by zhongdenny
About
·
Help
·
Advertise
·
Blog
·
API
·
FAQ
·
Solana
·
2466 Online
Highest 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms ·
UTC 11:05
·
PVG 19:05
·
LAX 04:05
·
JFK 07:05
♥ Do have faith in what you're doing.
❯