oldlamp

V2EX member #198842, joined on 2016-10-28 18:58:13 +08:00

Today's activity rank 4831

oldlamp 提问技术话题好玩工作信息交易信息城市相关

Per oldlamp's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

oldlamp's recent replies

19 mins ago

Replied to a topic by davidyin › Local LLM › 配置 kiro 的问题

你用第一台电脑的地址，以及它打开的端口，参考欧拉玛的那个配置，对外网局域网开放端口，然后在第二台机器上按照 open AI 的 API 格式输入你上边第一台机器的地址和端口，这样应该就能按照 open AI 的 AP AI 的方式来连接上了，这过程中的 API k 可以自己随意设置的。

20 mins ago

Replied to a topic by davidyin › Local LLM › 配置 kiro 的问题

@davidyin

https://mp.weixin.qq.com/s/6wIdqUgz2oJ8p2bosbkQfA

或许可以参考这类的指南，换一个 opencode 之类的工具呢？

2h 53m ago

Replied to a topic by davidyin › Local LLM › 配置 kiro 的问题

如果是本地模型，可以考虑 Qwen3.5 、Qwen3.6 之类的，2.5 太老了。

5 days ago

Replied to a topic by zzutmebwd › Local LLM › 关于低算力 gpu 推理时 prefill 在总时长中的占比问题

@zzutmebwd

对，这个关系目前不知道是不是能够找到一个均衡点

7 days ago

Replied to a topic by Melville › AI Agent 智能体 › 大家不要怕麻烦还是用国外的吧阿里百炼 coding plan 429 很容易

确实如此，已经退订。

9 days ago

Replied to a topic by dinfeo › 职场话题 › 双非本科，工作 15 年，今年 36 了，要不要考在职 985 研究生

@dinfeo

MBA 、MPA 、MEM ，恐怕都要陆续有可能退热。
至于英语一和英语二，我做过一段时间的相关培训，总体感受是差异没有想象的那么大。
管理类综合确实是比较友善。
心理学综合或许也可以考虑？

9 days ago

Replied to a topic by dinfeo › 职场话题 › 双非本科，工作 15 年，今年 36 了，要不要考在职 985 研究生

没考过在职的，但是读过全日制的 PHD 。
如果还在舒适区，熟悉的领域，可能用处不一定很大。
有没有考虑，或许可以换一个自己感兴趣的，同时又不太卡毕业的方向？

9 days ago

Replied to a topic by CatCode › Local LLM › Gemma4 12B 如何跑在 16G 显存上？

@coefu 确实如此，更大的显存容量用于上下文，能带来显著的 long horizon 场景的提升

14 days ago

Replied to a topic by zhengfan2016 › Local LLM › 消费级显卡(16G A 卡)是不是不适合运行 vllm 和 sglang，好像使用 transformer 推理都比这两个框架快，并且占用显存低

@zhengfan2016

您看 12 楼那位说的非常对，您如果用这款卡的，用 walk 来跑，速度会更快很多，我记得有人在 7900 xtx 上测试 qwen3.6-27b-q4km ，能快大概 10%左右

另外，如果用 glm 4 .7 flash 的话，好像能达到 100 多的 tokens/s

» More replies by oldlamp