oldlamp

oldlamp

V2EX member #198842, joined on 2016-10-28 18:58:13 +08:00
Today's activity rank 4831
Per oldlamp's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
oldlamp's recent replies
19 mins ago
Replied to a topic by davidyin Local LLM 配置 kiro 的问题
你用第一台电脑的地址,以及它打开的端口,参考欧拉玛的那个配置,对外网局域网开放端口,然后在第二台机器上按照 open AI 的 API 格式输入你上边第一台机器的地址和端口,这样应该就能按照 open AI 的 AP AI 的方式来连接上了,这过程中的 API k 可以自己随意设置的。
20 mins ago
Replied to a topic by davidyin Local LLM 配置 kiro 的问题
@davidyin


https://mp.weixin.qq.com/s/6wIdqUgz2oJ8p2bosbkQfA

或许可以参考这类的指南,换一个 opencode 之类的工具呢?
2h 53m ago
Replied to a topic by davidyin Local LLM 配置 kiro 的问题
如果是本地模型,可以考虑 Qwen3.5 、Qwen3.6 之类的,2.5 太老了。
@zzutmebwd

对,这个关系目前不知道是不是能够找到一个均衡点
确实如此,已经退订。
@dinfeo

MBA 、MPA 、MEM ,恐怕都要陆续有可能退热。
至于英语一和英语二,我做过一段时间的相关培训,总体感受是差异没有想象的那么大。
管理类综合确实是比较友善。
心理学综合或许也可以考虑?
没考过在职的,但是读过全日制的 PHD 。
如果还在舒适区,熟悉的领域,可能用处不一定很大。
有没有考虑,或许可以换一个自己感兴趣的,同时又不太卡毕业的方向?
9 days ago
Replied to a topic by CatCode Local LLM Gemma4 12B 如何跑在 16G 显存上?
@coefu 确实如此,更大的显存容量用于上下文,能带来显著的 long horizon 场景的提升
@zhengfan2016

您看 12 楼那位说的非常对,您如果用这款卡的,用 walk 来跑,速度会更快很多,我记得有人在 7900 xtx 上测试 qwen3.6-27b-q4km ,能快大概 10%左右

另外,如果用 glm 4 .7 flash 的话,好像能达到 100 多的 tokens/s
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5583 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 08:51 · PVG 16:51 · LAX 01:51 · JFK 04:51
♥ Do have faith in what you're doing.