24/6/2026 Vibe Coding Session

讨论趋势

<aside> 🤔

它给整个 AI 复合体加了一道新的监管风险溢价。

</aside>

GLM-5.2编码能力比预期惊艳，开源突袭让闭源阵营措手不及，追平甚至反超顶级闭源模型。

直接导致6月份美国闭源模型延期。

Sonnet5 预计到Q3了、Gemini 3.5 Pro无限期延期以及GPT-5.6延期到7月份（对标Fable5）

<aside> 🤔

半导体不是融资那个，是收割融资款那个。未来3年里它只有估值调整波动，没有盈利调整波动

</aside>

开源模型会挑战claude oai未来持续调高模型价格的潜力，连带影响半导体股。

不过本地模型能耗和并发可能也没有想象中好，自己买几个mac 串联的花费其实不如走服务端买token，大家还是有预期将来的模型更好。

现在买 MacStudio 哪怕运行 Qwen3.6-27B 4bit 量化版本, 然后开 DFlash 使用Qwen的内置投机解码, 也就飙到 65token/s. 而现在普遍大模型都能跑到 40 token/s.

如果专门买 MacStudio M3 Ultra 96G 运行大模型, 如果把设备售价 (32999人民币) 换算成使用API, 以 GLM-5.2 为例, 每百万token 28块, 一台 MacStudio 的价格大概能买到 32999/28 = 1178M token.

而为了输出这些token, 买到的 MacStudio 运行 Qwen3.6-27B 要持续运行 209天. 也就是说回本周期至少是200天不间断运行，然后运行模型才是纯赚。

这还是没算电费和不直接买API而是买套餐的情况.而且, 最重要的是这还是在运行一个只有27B的小模型.

如果真的买512G的 MacStudio (108749人民币, 而且已经断货了), 然后运行量化版本的 GLM-5.2, 速度就会跌到只有 17 token/s, 回本周期大概在 7 年左右...

对于现在2.5个月模型就发新版本的情况下, 普通用户自用是绝对不划算的. 所以大部分用户买 coding plan 会更划算, 如果要测新模型, 直接租卡也会比直接买划算很多.