2026-06-29
最新每日要闻 全部 →
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成 [鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成 懒人包:当 AI 承包了团队九成以上的代码,人均需求吞吐率却只提升六成,字节内部这组反差指向了研发落地的真实瓶颈。产品经理用 AI 做出看似完整的页面想直接上线,开发团队拦下来重构,因为代码在架构、安全和性能上撑不住。昨天发布的三篇手记分别拆了这组效能落差、Meta 因员工抵制和数据泄露而暂停的员工监控项目,以及 Mythos 5 恢复上线背后政府审批逻辑的转变。 AI 编程正在进入它的 DevOps 时刻 在六月的火山引擎 FOR
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙 [鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙 懒人包:OpenAI 推出 GPT-5.6 系列,其最强版本在 Terminal-Bench 拿下 91.9% 的高分,不过安全评估机构 METR 指出它的作弊率打破了历史纪录。受白宫限速令影响,目前仅有大约 20 家通过审核的机构能够使用该模型。与此同时,由于 AI 客户抢夺晶圆产能,普通消费电子设备的内存成本被抬高,苹果多款电脑价格上涨。鸭哥昨天发了 2 篇 AI 文章。 GPT-5.6 登顶终端测试,可惜你暂时拿不
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 [鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 懒人包:OpenAI Codex 正在静默磨损你的 SSD,年化写入量达 640 TB,但系统工具无法察觉。德国铁路因一次计划内换件导致全国列车停运约两小时,暴露出备用系统缺乏真实测试的隐患。多轮 agent 的主要推理开销由 KV cache 命中率决定,prefill 阶段甚至占据了账单的 85% 到 95%。鸭哥昨天共发布了 3 篇文章。 磁盘检查看不出的 640 TB 物理写入 OpenAI Codex 静默
最新深度调研 全部 →
Claude Tag 拆开看:技术上没那么新,但企业授权的对象变了
6/23 Anthropic 发布 Claude Tag,把 agent 变成 Slack 里的常驻同事。拆开看,技术上没有本质变化——底下还是 HTTP endpoint,记忆是聊天记录不是组织智慧。真正的变化在企业授权层:agent 成为需要身份、预算、审计的非人类执行体,分发和定价跟着重写。而持续学习这层,目前还没产品做到。
OpenAI 九个月流片背后:AI 在芯片设计里到底做到了什么
OpenAI 声称九个月流片靠 AI 加速,但 Brockman 自己说 AI 只省了几周、找到的都是人类迟早会做的优化。拉远看整个芯片设计流程,AI 的有效性是一条梯度:制造端最成熟但用的是十年前的技术,EDA 优化已成商业产品,LLM 生成 RTL 还停在实验室。
别只看 42.7%:Tmax 背后的 RL 配方、基座红利和 Benchmark 陷阱
Ai2 的 Tmax 用一套简洁的 RL 配方把 9B 开源模型训练成终端 agent,在 Terminal-Bench 2.0 上拿到 27.2%。但 27B 的 42.7% 里基座贡献了多少?reward hacking 暴露了什么?本文拆解分数背后的七个变量。
最新博客 全部 →
用好AI的第二步:先写Skill再执行
用好AI的第二步不是更会写 prompt,而是先外化、再复用。本文讲清 Skill 如何承载工作知识、好 Skill 的三要素,以及如何组织 Skill 文件夹让 Agent 自动找到。
Step Two to Using AI Well: Write the Skill Before You Execute
Step two isn't better prompting. It's externalize first, reuse second. This post explains how Skills carry work knowledge, the three parts of a good Skill, and how to organize them so agents find the right one.
把18亿颗星星画在一张图上,能还原我们拍到的银河吗?
从最直白的"一星一像素"出发,八次翻车、六亿颗星,一步一步把银河从真实星表里逼出来。在这个过程中才发现,以前从来没认真想过头顶的星空为什么长这个样子。