V2EX › aes114514gcm 的所有回复 › 第 1 页 / 共 5 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2 3 4 5

❮

❯

1 天前

回复了 abc0123xyz 创建的主题 › 程序员 › 建议过半个月再看看 glm5.2，不要急着上车充钱

降智归降智，还是国模里最能打的。

2 天前

回复了 unt 创建的主题 › 程序员 › deepseek 有没有官方技术服务团队

TO B 才能有

3 天前

回复了 wangchengwu 创建的主题 › 小米 › mimo code 正式发布，号称无限上下文，越用越聪明

@Rickkkkkkk 博客有提到，实现方式有点不一样。
https://mimo.xiaomi.com/zh/blog/mimo-code-long-horizon

![图片.png]( https://s3.bmp.ovh/2026/06/11/PV5eRGWP.png)

3.1 Cycle：无界会话的基本单元

把会话想象成一串从左到右排开的 turn。窗口有上限，turn 在累积，窗口终会被填满。如果不干预，会话到达上限时要么结束，要么悄悄退化。

运行时在到达上限之前的几个固定位置介入。我们称这些位置为 checkpoint。每个 checkpoint 处，运行时派出一个独立的 writer subagent：读取迄今的对话，将一份结构化状态写入磁盘。主 Agent 继续工作，writer 并发执行，互不干扰。

当窗口接近真正的上限，运行时执行一次 rebuild：切断当前窗口，开启新窗口，用已持久化的文件作为种子重建上下文。主 Agent 在新窗口中醒来，状态已摆在面前，继续工作。从模型视角看，对话从未中断；从运行时视角看，一个新的物理窗口已经开始。

一段被 checkpoint 打过点、最终以 rebuild 收尾的 turn 序列，是一个 cycle。Cycle 没有数量上限——每一个 cycle 受限于物理窗口大小，但逻辑会话是 cycle 的链，而那条链没有最大长度。
3.2 为什么提早提取

一种自然的直觉是把提取拖到窗口快满时。我们发现这恰好是反着的。

第一，模型在高上下文利用率下能力会衰减。这在文献中被称为 "lost in the middle"：随着输入变长，对中段材料的注意力下降，结构化提取的可靠性显著降低。要求模型在它的压缩能力正在退化的时刻去做最关键的压缩，是一桩划不来的交易。

第二，提取本身需要空间。Writer 必须读完历史、维持解读、写出结构化输出——全部在同一个窗口里。95% 利用率下已无处思考；30% 利用率下则游刃有余。

因此 checkpoint 在远低于上限处触发——大致在已配置预算的 20%、45%、70%。每一次触发都是对前一次的增量更新，没有任何一次是孤注一掷的总结。最末尾接近上限的那次 rebuild，不是一次仓促的压缩，而是将一路记下来的结构化记录变现的时刻。

4 天前

回复了 wangchengwu 创建的主题 › 小米 › mimo code 正式发布，号称无限上下文，越用越聪明

4 楼是挺搞笑的，没用过就来喷，只会输出情绪。

4 天前

回复了 yu6564172 创建的主题 › 全球工单系统 › Linux do 的访问稳定性问题

如果要写小作文，那我确实没什么兴趣。
最近不是开发注册了吗，那去看看也无所谓。

6 天前

回复了 Brightt 创建的主题 › 问与答 › 回复 R 拒收短信真有效果吗？

贷款理财，保险推销，零售业推广，电信业务宣传，网络游戏推广......
运营商把端口分的很细致了，可以精准拦截，偶尔有漏网之鱼补上。

6 天前

回复了 Brightt 创建的主题 › 问与答 › 回复 R 拒收短信真有效果吗？

@Brightt 目前投诉+黑名单没有遇到收不到正常短信的情况。投诉建议去运营商的自有平台（天翼防骚扰/中国移动高频骚扰电话防护）效果很好。而不是 12321，12321 受理后还是要运营商转办的。

拦截有开关，有记录。

6 天前

回复了 bush911 创建的主题 › 微信 › 作为程序员的你，和作为普通群体你是如何吐槽微信的

腾讯的各种产品强制微信扫码登录确实 sb，好在有些现在也支持 passkey 了，少吃点苦。
业务流程为什么要和微信强耦合？各种和 im 没有任何关系的产品硬要微信扫码。

至少我是不希望微信对生活侵入过多的，离开手机什么都做不了，所有生态都绑上面，一个单点故障全部玩完。

7 天前

回复了 dirkchou 创建的主题 › 微信 › 微信不理会一小撮用户的吐槽是对的，大部分人用着没问题不会吐槽

客观来说，很多用户的“吐槽”是缺乏价值的。
但这不是微信躺在屎山上的理由，公认的垃圾软件。

8 天前

回复了 SayHelloHi 创建的主题 › 程序员 › 咨询：国内 AI 模型哪个编程效果好？

2 楼是有点离谱，v4 不用，不知道去哪扒拉 v3.

11 天前

回复了 frantic 创建的主题 › 程序员 › 强大的 Qwen3.7-Max 在 Qoder CLI CN 中可以免费用一个月

@frantic 它用的是 Qoder CLI v1.0.13，你用的是 Qoder CLI CN v1.0.12。注意到区别没有，一看这不是套皮的 qwen code 吗

13 天前

回复了 Croow 创建的主题 › 程序员 › 国产模型选哪个来编码？

能力至上就选 glm5.1，便宜可以考虑 ds v4pro 和 mimo 2.5pro
至于小米的 token plan 很多人说套路，我实测编程场景下缓存命中大概 95%上下，换算 token 和 credits 大概是 1：21。按 pro 套餐原价 329 算算每百万 tokens0.17 元（输入输出统一口径计算）。按我现在的用量算只便宜了 6 元。。。
（如果没有用量重置和夜间折扣的话确实不太值得）

14 天前

回复了 Rorysky 创建的主题 › 问与答 › 为什么就 deepseek 和 GLM 要实名身份证认证？

xiami mimo 充值也是要实名的。理论上涉及支付都需要实名认证，这也是个合规问题。

14 天前

回复了 PhpBB 创建的主题 › 经济 › 人口应该重新回到大城市?

都市圈协同发展+壮大县域经济。
而绝不是所谓人口重新回到大城市，没有农村作为血包持续输出劳动力是不能维持巨型城市了，必然涉及功能疏解产业转移。推进城市化不意味着非要向少数超大城市聚集。

5 月 28 日

回复了 rockxsj 创建的主题 › 程序员 › 芒果 TV 好像在送免费的 glm 5.1 和 ds v4？

@404www
| 模型名称 | 单价 | RPM 限流 | 可调用有效期 |
|---|---|---|---|
| qwen3.6-plus | 限时免费 | 60 | 05-31 23:59 |
| qwen3.6-max-preview | 限时免费 | 60 | 05-31 23:59 |
| qwen3.6-flash | 限时免费 | 60 | 05-31 23:59 |
| qwen3.5-plus | 限时免费 | 60 | 05-31 23:59 |
| deepseek-v4-pro | 限时免费 | 60 | 05-31 23:59 |
| deepseek-v4-flash | 限时免费 | 60 | 05-31 23:59 |
| qwen3-vl-plus | 限时免费 | 60 | 05-31 23:59 |
| glm-5.1 | 限时免费 | 60 | 05-31 23:59 |
| glm-5 | 限时免费 | 60 | 05-31 23:59 |

本质是个中转站，从百炼进货

5 月 27 日

回复了 TuTouPower 创建的主题 › 程序员 › 白送一千亿 token 谁用得完！ MiMo 续费倒找钱，最新羊毛！

@leglo 要做 token plan 都是这样玩的啊，模型单位 token 成本不一样，中间需要一个单位来等价转换。
纯按量计费不就没有 credit 这玩意了。。。。

5 月 27 日

回复了 shuang 创建的主题 › 程序员 › 寻找 postman、xshell、navicat 的替代软件

postman: apifox

xshell: openssh（win11 预装了）

navicat：datagrip

5 月 27 日

回复了 guoguobaba 创建的主题 › 程序员 › idea 下哪个 ai 助手好用一些？

各种 cli 里配置好 idea 暴露的 mcp

1 2 3 4 5

❮

❯