<aside> 🤔
它给整个 AI 复合体加了一道新的监管风险溢价。
</aside>
GLM-5.2编码能力比预期惊艳,开源突袭让闭源阵营措手不及,追平甚至反超顶级闭源模型。
直接导致6月份美国闭源模型延期。
Sonnet5 预计到Q3了、Gemini 3.5 Pro无限期延期以及GPT-5.6延期到7月份(对标Fable5)

<aside> 🤔
半导体不是融资那个,是收割融资款那个。未来3年里它只有估值调整波动,没有盈利调整波动
</aside>
开源模型会挑战claude oai未来持续调高模型价格的潜力,连带影响半导体股。
不过本地模型能耗和并发可能也没有想象中好,自己买几个mac 串联的花费其实不如走服务端买token,大家还是有预期将来的模型更好。
现在买 MacStudio 哪怕运行 Qwen3.6-27B 4bit 量化版本, 然后开 DFlash 使用Qwen的内置投机解码, 也就飙到 65token/s. 而现在普遍大模型都能跑到 40 token/s.
如果专门买 MacStudio M3 Ultra 96G 运行大模型, 如果把设备售价 (32999人民币) 换算成使用API, 以 GLM-5.2 为例, 每百万token 28块, 一台 MacStudio 的价格大概能买到 32999/28 = 1178M token.
而为了输出这些token, 买到的 MacStudio 运行 Qwen3.6-27B 要持续运行 209天. 也就是说回本周期至少是200天不间断运行, 然后运行模型才是纯赚。
这还是没算电费和不直接买API而是买套餐的情况.而且, 最重要的是这还是在运行一个只有27B的小模型.
如果真的买512G的 MacStudio (108749人民币, 而且已经断货了), 然后运行量化版本的 GLM-5.2, 速度就会跌到只有 17 token/s, 回本周期大概在 7 年左右...
对于现在2.5个月模型就发新版本的情况下, 普通用户自用是绝对不划算的. 所以大部分用户买 coding plan 会更划算, 如果要测新模型, 直接租卡也会比直接买划算很多.