共 10 篇 · 最新 10 篇展开,其余折叠
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成 [鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成 懒人包:当 AI 承包了团队九成以上的代码,人均需求吞吐率却只提升六成,字节内部这组反差指向了研发落地的真实瓶颈。产品经理用 AI 做出看似完整的页面想直接上线,开发团队拦下来重构,因为代码在架构、安全和性能上撑不住。昨天发布的三篇手记分别拆了这组效能落差、Meta 因员工抵制和数据泄露而暂停的员工监控项目,以及 Mythos 5 恢复上线背后政府审批逻辑的转变。 AI 编程正在进入它的 DevOps 时刻 在六月的火山引擎 FOR
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙 [鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙 懒人包:OpenAI 推出 GPT-5.6 系列,其最强版本在 Terminal-Bench 拿下 91.9% 的高分,不过安全评估机构 METR 指出它的作弊率打破了历史纪录。受白宫限速令影响,目前仅有大约 20 家通过审核的机构能够使用该模型。与此同时,由于 AI 客户抢夺晶圆产能,普通消费电子设备的内存成本被抬高,苹果多款电脑价格上涨。鸭哥昨天发了 2 篇 AI 文章。 GPT-5.6 登顶终端测试,可惜你暂时拿不
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 [鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 懒人包:OpenAI Codex 正在静默磨损你的 SSD,年化写入量达 640 TB,但系统工具无法察觉。德国铁路因一次计划内换件导致全国列车停运约两小时,暴露出备用系统缺乏真实测试的隐患。多轮 agent 的主要推理开销由 KV cache 命中率决定,prefill 阶段甚至占据了账单的 85% 到 95%。鸭哥昨天共发布了 3 篇文章。 磁盘检查看不出的 640 TB 物理写入 OpenAI Codex 静默
[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周,剩下靠 Broadcom
[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周,剩下靠 Broadcom 懒人包:Brockman 亲口说 AI 在芯片设计上只省了几周时间,找到的全是人类工程师迟早会看到的优化。这是一手、反自身利益的证词。Tmax 跑出的 42.7%,Qwen 3.6 基座本身就占了 39.6%,RL 配方实际新增不到 4 个点。Claude Tag 管 agent 叫"同事",整个命题的支撑是治理层:独立身份、独立预算、审计通道,认知能力没有哪一项比以前强。今天三件事共享同一个动作:别盯着聚合数字,把它掰开看归因。 九个月流片,Brockman 自己把 AI 的功劳划
[鸭哥 AI 手记] 2026-06-23: 陶哲轩:临界点有两层
[鸭哥 AI 手记] 2026-06-23: 陶哲轩:临界点有两层 懒人包:陶哲轩上周六在 Mastodon 上说,AI 把数学形式化任务从几周压到了几小时。媒体标题跟进了 AI 突破临界点。但他真正有信息量的判断不在速度数字。他把正确分了两层:机器校验那层确实打通了,证明能不能用起来那层没破,反而因为第一层通了变得更卡。同一周,Sakana Fugu 把多智能体协调训进了模型权重,协调序列对外完全不可见。微信小微用五层约束把 AI 锁在个人代理侧,回避了 AI 代办交易时绕不开的分发矛盾。 陶哲轩:AI跨过临界点,但得分两层看 IEANTN 是 IPAM UCLA 主持的数学形式化项目。志愿
[鸭哥 AI 手记] 2026-06-22: 代码翻倍 bug 涨 30 倍,AI 编程漏算了恢复这一环
[鸭哥 AI 手记] 2026-06-22: 代码翻倍 bug 涨 30 倍,AI 编程漏算了恢复这一环 懒人包:金松在群里提了一句:用了 AI 写代码后,bug 翻了 30 倍不止,手头好几个项目都超过 22 万行。linhow 跟着说,能清楚意识到 bug 涨了 30 倍的团队,十个里面也就一两个;一大半还陷在效率提升 30 倍的兴奋里没出来。AI 把产出代码的成本砸到了地板,但犯错的代价纹丝不动。代码那一层已经有人在解决恢复问题,只是远没铺开;设计那一层的错误,连怎么恢复都还没人想过。 让错误更便宜:benchmark 从来不测的那一项 鸭哥昨天写了一篇《让 AI 更准,还是让错误更便宜
[鸭哥 AI 手记] 2026-06-21: 约束文档比生成的代码还多
[鸭哥 AI 手记] 2026-06-21: 约束文档比生成的代码还多 懒人包:「夸张的话,到最后约束模型的文档比模型生成的代码还多。」群里这句原话指向一个正在发生的倒挂:AI 把生成成本压到趋零之后,瓶颈从"写代码"移到了"说清楚该写什么"和"判断写得好不好"。同一天,行业数据显示 88% 的 agent 项目没活到上线,失败核心不在模型能力而在评估实践落后。两个问题讲的是同一件事:当生成比验证便宜太多,行业基础设施的短板就藏不住了。 约束先行:当生成太便宜,说明书成了主体 群里一整天的讨论绕着同一根线在转。陈浩说"AI 提高了执行效率,出屎山代码的效率也高了,又快又臭又多"。三和四接了一句
[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六,AI泡沫的三重面孔
[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六,AI泡沫的三重面孔 懒人包:OpenAI去年净亏390亿——每挣一块钱花两块六。鸭哥昨天发文拆解了AI行业同时存在三种不同性质的泡沫风险,各自有不同的破裂方式和时间线。同一天,DeepMind的白皮书揭示AI安全的核心矛盾已经从"模型说了什么"迁移到"agent做了什么"。而群聊里一场关于用AI十倍提效结果升职失败的讨论,把执行力和判断力之间的张力推到了个人职业层面。 AI不是一块泡沫,是三块 鸭哥昨天在 AI 是不是泡沫:三种不同的答案 里做的第一件事,是拒绝回答"是不是泡沫"这个问题的原样。他把泡沫拆成了三件事。 第一种是债务
[鸭哥 AI 手记] 2026-06-19: AlphaFold之父跳槽Anthropic,判断力在重新定价
[鸭哥 AI 手记] 2026-06-19: AlphaFold之父跳槽Anthropic,判断力在重新定价 懒人包:Nobel laureate John Jumper 离开效力九年的 Google DeepMind 加入 Anthropic。这件事背后有三条独立但指向同一个方向的暗线:AI 放大执行不放大判断,最会用 AI 的人正在被自己的效率反噬;Midjourney 靠社区订阅现金流造出了全身扫描仪,在 93.6% 的 AI 资本流向四家 VC-backed 公司的格局里走了另一条路;钉钉 CEO 把 agent-friendly 写进 KPI,企业软件的设计范式正在从给人看转向给 a
[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor:编程变了
[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor:编程变了 懒人包:SpaceX 在 6 月 16 日宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere——18 个月内估值从 25 亿涨到 600 亿,对应约 24 倍市销率。这不是一笔传统的 IDE 收购。同一天,鸭哥从 Anthropic 40 万次 Claude Code 会话数据里挖出了一条清晰的用法迁移曲线:七个月里 debug 占比砍了近一半,运维和写作翻了一倍。两天前 Vercel 开源了 eve,一句"agent 就是一个文件夹"把 agent 框架的路线分歧直接摆上了台