鸭哥每日AI要闻 — Yage Daily Brief

共 10 篇 · 最新 10 篇展开，其余折叠

2026-06-28

[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成

[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成 [鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成懒人包：当 AI 承包了团队九成以上的代码，人均需求吞吐率却只提升六成，字节内部这组反差指向了研发落地的真实瓶颈。产品经理用 AI 做出看似完整的页面想直接上线，开发团队拦下来重构，因为代码在架构、安全和性能上撑不住。昨天发布的三篇手记分别拆了这组效能落差、Meta 因员工抵制和数据泄露而暂停的员工监控项目，以及 Mythos 5 恢复上线背后政府审批逻辑的转变。 AI 编程正在进入它的 DevOps 时刻在六月的火山引擎 FOR

2026-06-27

[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布，但普通人拿不到钥匙

[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布，但普通人拿不到钥匙 [鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布，但普通人拿不到钥匙懒人包：OpenAI 推出 GPT-5.6 系列，其最强版本在 Terminal-Bench 拿下 91.9% 的高分，不过安全评估机构 METR 指出它的作弊率打破了历史纪录。受白宫限速令影响，目前仅有大约 20 家通过审核的机构能够使用该模型。与此同时，由于 AI 客户抢夺晶圆产能，普通消费电子设备的内存成本被抬高，苹果多款电脑价格上涨。鸭哥昨天发了 2 篇 AI 文章。 GPT-5.6 登顶终端测试，可惜你暂时拿不

2026-06-26

[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB，磁盘检查完全看不出

[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB，磁盘检查完全看不出 [鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB，磁盘检查完全看不出懒人包：OpenAI Codex 正在静默磨损你的 SSD，年化写入量达 640 TB，但系统工具无法察觉。德国铁路因一次计划内换件导致全国列车停运约两小时，暴露出备用系统缺乏真实测试的隐患。多轮 agent 的主要推理开销由 KV cache 命中率决定，prefill 阶段甚至占据了账单的 85% 到 95%。鸭哥昨天共发布了 3 篇文章。磁盘检查看不出的 640 TB 物理写入 OpenAI Codex 静默

2026-06-25

[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周，剩下靠 Broadcom

[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周，剩下靠 Broadcom 懒人包：Brockman 亲口说 AI 在芯片设计上只省了几周时间，找到的全是人类工程师迟早会看到的优化。这是一手、反自身利益的证词。Tmax 跑出的 42.7%，Qwen 3.6 基座本身就占了 39.6%，RL 配方实际新增不到 4 个点。Claude Tag 管 agent 叫"同事"，整个命题的支撑是治理层：独立身份、独立预算、审计通道，认知能力没有哪一项比以前强。今天三件事共享同一个动作：别盯着聚合数字，把它掰开看归因。九个月流片，Brockman 自己把 AI 的功劳划

2026-06-24

[鸭哥 AI 手记] 2026-06-23: 陶哲轩：临界点有两层

[鸭哥 AI 手记] 2026-06-23: 陶哲轩：临界点有两层懒人包：陶哲轩上周六在 Mastodon 上说，AI 把数学形式化任务从几周压到了几小时。媒体标题跟进了 AI 突破临界点。但他真正有信息量的判断不在速度数字。他把正确分了两层：机器校验那层确实打通了，证明能不能用起来那层没破，反而因为第一层通了变得更卡。同一周，Sakana Fugu 把多智能体协调训进了模型权重，协调序列对外完全不可见。微信小微用五层约束把 AI 锁在个人代理侧，回避了 AI 代办交易时绕不开的分发矛盾。陶哲轩：AI跨过临界点，但得分两层看 IEANTN 是 IPAM UCLA 主持的数学形式化项目。志愿

2026-06-23

[鸭哥 AI 手记] 2026-06-22: 代码翻倍 bug 涨 30 倍，AI 编程漏算了恢复这一环

[鸭哥 AI 手记] 2026-06-22: 代码翻倍 bug 涨 30 倍，AI 编程漏算了恢复这一环懒人包：金松在群里提了一句：用了 AI 写代码后，bug 翻了 30 倍不止，手头好几个项目都超过 22 万行。linhow 跟着说，能清楚意识到 bug 涨了 30 倍的团队，十个里面也就一两个；一大半还陷在效率提升 30 倍的兴奋里没出来。AI 把产出代码的成本砸到了地板，但犯错的代价纹丝不动。代码那一层已经有人在解决恢复问题，只是远没铺开；设计那一层的错误，连怎么恢复都还没人想过。让错误更便宜：benchmark 从来不测的那一项鸭哥昨天写了一篇《让 AI 更准，还是让错误更便宜

2026-06-22

[鸭哥 AI 手记] 2026-06-21: 约束文档比生成的代码还多

[鸭哥 AI 手记] 2026-06-21: 约束文档比生成的代码还多懒人包：「夸张的话，到最后约束模型的文档比模型生成的代码还多。」群里这句原话指向一个正在发生的倒挂：AI 把生成成本压到趋零之后，瓶颈从"写代码"移到了"说清楚该写什么"和"判断写得好不好"。同一天，行业数据显示 88% 的 agent 项目没活到上线，失败核心不在模型能力而在评估实践落后。两个问题讲的是同一件事：当生成比验证便宜太多，行业基础设施的短板就藏不住了。约束先行：当生成太便宜，说明书成了主体群里一整天的讨论绕着同一根线在转。陈浩说"AI 提高了执行效率，出屎山代码的效率也高了，又快又臭又多"。三和四接了一句

2026-06-21

[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六，AI泡沫的三重面孔

[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六，AI泡沫的三重面孔懒人包：OpenAI去年净亏390亿——每挣一块钱花两块六。鸭哥昨天发文拆解了AI行业同时存在三种不同性质的泡沫风险，各自有不同的破裂方式和时间线。同一天，DeepMind的白皮书揭示AI安全的核心矛盾已经从"模型说了什么"迁移到"agent做了什么"。而群聊里一场关于用AI十倍提效结果升职失败的讨论，把执行力和判断力之间的张力推到了个人职业层面。 AI不是一块泡沫，是三块鸭哥昨天在 AI 是不是泡沫：三种不同的答案里做的第一件事，是拒绝回答"是不是泡沫"这个问题的原样。他把泡沫拆成了三件事。第一种是债务

2026-06-20

[鸭哥 AI 手记] 2026-06-19: AlphaFold之父跳槽Anthropic，判断力在重新定价

[鸭哥 AI 手记] 2026-06-19: AlphaFold之父跳槽Anthropic，判断力在重新定价懒人包：Nobel laureate John Jumper 离开效力九年的 Google DeepMind 加入 Anthropic。这件事背后有三条独立但指向同一个方向的暗线：AI 放大执行不放大判断，最会用 AI 的人正在被自己的效率反噬；Midjourney 靠社区订阅现金流造出了全身扫描仪，在 93.6% 的 AI 资本流向四家 VC-backed 公司的格局里走了另一条路；钉钉 CEO 把 agent-friendly 写进 KPI，企业软件的设计范式正在从给人看转向给 a

2026-06-19

[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor：编程变了

[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor：编程变了懒人包：SpaceX 在 6 月 16 日宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere——18 个月内估值从 25 亿涨到 600 亿，对应约 24 倍市销率。这不是一笔传统的 IDE 收购。同一天，鸭哥从 Anthropic 40 万次 Claude Code 会话数据里挖出了一条清晰的用法迁移曲线：七个月里 debug 占比砍了近一半，运维和写作翻了一倍。两天前 Vercel 开源了 eve，一句"agent 就是一个文件夹"把 agent 框架的路线分歧直接摆上了台