Yage Daily Brief

鸭哥三个站点的每日内容追踪 — 价值评估 + 跨日脉络

2026-06-29 · 首期 · 回溯近两日

今日要点

本周核心脉络:AI 编程效率幻觉的拆解

从 6/18 SpaceX 600 亿买 Cursor 开始,鸭哥的内容在追踪一条连续的线索:AI 编程的产出数字很好看,但交付数字远不如产出数字。6/22 代码翻倍 bug 涨 30 倍,6/21 约束文档比代码还多,6/25 Codex 静默写崩 SSD,6/27 字节内部数据 90% AI 代码只换 60% 吞吐提升 — 这组数据不是否定 AI 编程,而是在精确测绘瓶颈位置:生成端加速了,判断端和恢复端没跟上。对个人使用 AI 的启示很直接:AI 让你快的那部分,恰恰可能是你最不该快的地方。

每日要闻 6/28 发布

九成代码靠 AI 写,交付只快六成

字节 TRAE 团队超 90% 代码由 AI 编写,人均需求吞吐率只提了 60%。瓶颈已从生成端转移到需求分析、架构设计和可维护性。产品经理用 AI 做出页面想直接上线,开发团队得拦下来重构。
值得深读 — 这是本周 AI 编程效率讨论的定调数据。鸭哥抓的 90% vs 60% 这组反差,把抽象的“AI 提效没那么神”钉在了具体数字上。对你(也在用 AI 编程)来说,核心问题是省下的时间花在哪了。
每日要闻 6/27 发布

GPT-5.6 发布,但普通人拿不到钥匙

GPT-5.6 Sol 在 Terminal-Bench 拿到 91.9%,超过 Anthropic Mythos 5 的 88%。但白宫限速令下只有约 20 家机构能用。同时 AI 挤占晶圆产能推高了消费电子内存成本。
值得深读 — 这是产业层面的关键信号。模型能力在涨,但访问控制在收紧。AI 产业正在从“谁做得好”变成“谁被允许用”,这对格局判断很重要。
每日要闻 6/26 发布

静默写入 640 TB,磁盘检查完全看不出

Codex CLI 的 SQLite 写入存在硬编码 TRACE 日志缺陷,年化写入 640 TB,逼近消费级 SSD 寿命上限。系统工具无法察觉,因为写入被归类为日志。
值得深读 — 这不是个技术 bug 报告,是一个隐喻:AI 工具的隐性成本。你以为它在帮你写代码,它在悄悄磨损你的硬件。跟上周 AI 泡沫讨论形成互补:成本不仅在云端,也在本地。

Deep News 深度调研 (6/28)

深度调研 6/28

AI 补贴退潮后,agent 开始按每美元智能计价

企业开始给 AI token 算账后,agent 设计目标函数从使用量转向每美元可靠任务结果。上下文治理、模型路由和 eval-driven routing 正在凝结成新的工程学科:context engineering。
值得深读 — 这跟你目前在做的 context infrastructure 高度相关。KV cache 命中率、context engineering 这些概念正好是你探索的方向。
深度调研 6/28

RPA 正在从重放点击变成重放业务意图

OpenAI Codex 的 Record & Replay 表面是录工作流,背后是自动化资产从 selector/键鼠动作上移到目标、输入、决策点和验证标准。
快速浏览 — RPA 范式迁移的角度有趣,但跟你当前关注点重合度不高。如果后面 Codex 的 skill 体系跟 Claude Code 的 skill 体系形成竞争关系,值得回头再看。
深度调研 6/28 (内容日期 6/27)

前沿模型安全正在移入运行时

GPT-5.6 运行时安全栈 vs Anthropic 白盒评估,指向同一转折:安全从“模型会不会拒答”变成“运行时如何被监控”。
快速浏览 — 安全治理的工程路径分歧。对理解 OpenAI 和 Anthropic 的策略差异有帮助,但不是日常关心的问题。
深度调研 6/28 (内容日期 6/27)

AI 编程正在进入它的 DevOps 时刻

字节 TRAE 90% AI 代码占比和 60% 吞吐提升,瓶颈从生成转向交付流水线。Harness 正在扮演 AI 代码时代的 CI/CD。
值得深读 — 跟每日要闻的 90% vs 60% 是同一组数据的不同切面。鸭哥从 DevOps 角度切入,把“AI 编程的瓶颈在哪”讲得更工程化。值得搭配阅读。
深度调研 6/27

AI 正在让每一台电子设备变贵

三家内存公司通过产能分配权,把 AI 基建成本摊进每台手机和电脑。美光毛利率 84.9% 超过台积电,消费者和 builder 都在为 AI 买单。
值得深读 — 经济与股市板块的直接内容。AI 的成本传导机制:不是买 AI 服务才付钱,你买台新电脑也在付钱。这是理解 AI 经济影响的一个被低估的视角。
深度调研 6/27

白宫的限速器:GPT-5.6 发布被按下暂停键

GPT-5.6 能力、System Card、安全评级、白宫介入机制的全面梳理。没有进入 ChatGPT,没有公开 API 申请入口。
值得深读 — 对理解 AI 治理的实际运作方式很有价值。不是抽象的“监管来了”,而是具体的一步一步怎么掐的。

Computing Life 博客

博客 6/22

使用AI暴力模拟月全食的绿松石带

从最土的白圆盘开始,一层层加物理,硬算出月食绿松石带。在翻车中发现 AI 太懂物理,反而会把人带进前人留下的近似里。
快速浏览 — 天文+AI 的跨界实验,鸭哥的招牌风格。有趣但不紧急。核心洞见“AI 太懂一个领域反而带偏你”跟 6/24 的 Brockman 承认 AI 只省几周是同一类判断:AI 的知识是前人的近似,不是真理。
博客 6/20

使用AI十倍提效,成了模范老黄牛,就能加薪升职了?

用 AI 提效后产出和 rating 都是 org 最高,升职两次失败。讽刺陷阱:手快好用让老板把你当手而非脑。最擅长用 AI 的人,反而最容易被 AI 替代。
值得深读 — 这篇跟你直接相关。你也在大量用 AI 提效,也面临着“省下的时间用来做什么”的问题。鸭哥的破解之道(省下的时间做判断而非更多交付)跟你的“好奇驱动”转型方向一致。

跨日脉络

AI 编程效率的测量与误读(6/18 - 6/27)

SpaceX 600 亿买 Cursor (6/18) → Claude Code 使用曲线从 debug 转向运维 (6/19) → 代码翻倍 bug 涨 30 倍 (6/22) → 约束文档比生成代码还多 (6/21) → Codex 静默磨损 SSD (6/25) → 字节 90% vs 60% 定调数据 (6/27)。这条线在测绘同一个问题:生成端的效率数字好看,但交付端、判断端、恢复端、隐性成本端全没跟上。鸭哥是最早开始系统拆解这个落差的观察者之一。
跨度 10 天 · 覆盖 6 篇文章 · 状态:活跃追踪中

AI 经济学:泡沫、定价权与成本传导(6/19 - 6/27)

OpenAI 每挣一块花两块六 (6/20) → 三家内存寡头毛利率超台积电 (6/26) → 判断力溢价 vs 执行力贬值 (6/19) → Agent 按每美元智能计价 (6/28)。这条线从不同切面在讲 AI 的真实成本结构:谁在挣钱,谁在亏钱,成本怎么传导到普通消费者。
跨度 10 天 · 覆盖 4 篇文章 · 状态:活跃追踪中

前沿模型的政治化:发布不再是工程决策(6/26 - 6/28)

GPT-5.6 白宫限速 (6/26) → Mythos 5 白名单恢复 (6/27) → 运行时安全 vs 评估安全 (6/27)。AI 发布从“做好了就发”变成“政府同意才发”,这不是监管,是许可制。
跨度 3 天 · 覆盖 3 篇文章 · 状态:活跃追踪中