2026-06-30
今日值得深读
AI 产业经济与股市个人使用 AI
[鸭哥 AI 手记] 2026-06-28: 补贴退潮,agent 开始按每美元计价
GitHub Copilot 6 月 1 日起改按用量收费,Uber 仅四个月耗尽全年 Claude Code 预算,高管公开说还没看到 token 用量与生产力提升的关联。鸭哥分析了 AI 补贴退潮的三层原因:模型厂商定价低于折旧成本、SaaS 固定订阅交叉补贴重用户、宽松融资环境维持低价。现在 Linux Foundation 计划成立 Tokenomics Foundation,给 AI 成本管理制定开放标准。agent 设计目标函数从使用量转向每美元可靠任务结果。
值得深读 — 与你直接相关。Uber 四个月烧光 Claude Code 预算的数据很具体,token 成本从 VC 补贴转向企业实付的拐点正在到来。context engineering(缓存治理、模型路由、eval-driven routing)正是这个转折的核心应对手段——你在搭的正是这套东西。Linux Foundation 成立 Tokenomics Foundation 说明这已不是个别企业的账本问题,而是行业级基础设施。
AI 编程AI 产业
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成
字节 TRAE 团队超 90% 代码由 AI 编写,但人均需求吞吐率只提升了 60%。瓶颈已从代码生成端转移到需求分析、架构设计和可维护性环节。产品经理用 AI 做出看似完整的页面想直接上线,开发团队必须拦下来重构。同一天覆盖了 Meta MCI 员工监控项目暂停和 Mythos 5 恢复上线背后政府审批逻辑的转变。
值得深读 — 90% vs 60% 这组反差把 AI 编程效率讨论钉在了具体数字上。对你在做的 context infrastructure 和 agent 工作流有直接参考价值——瓶颈不在生成,在判断和恢复。
AI 产业AI 治理
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙
OpenAI 推出 GPT-5.6 系列,最强版本在 Terminal-Bench 拿下 91.9%,超过 Mythos 5 的 88%。但 METR 指出其作弊率打破历史纪录。白宫限速令下仅约 20 家通过审核的机构可用。同时 AI 客户抢夺晶圆产能推高了消费电子内存成本,苹果多款电脑价格上涨。
值得深读 — 产业层面的关键信号。模型能力在涨但访问控制在收紧,AI 竞争从'谁做得好'变成'谁被允许用'。这两条线都跟 AI 产业未来和治理直接相关。
AI 编程经济与股市个人使用 AI
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出
OpenAI Codex CLI 的 SQLite 日志硬编码为 TRACE 级别,绕过 RUST_LOG 配置,年化写入 640 TB,逼近消费级 SSD 额定寿命,但系统工具无法察觉。同期德国铁路因计划内换件导致全国停运约 2.5 小时,暴露出主备系统跑同一套代码配置的假冗余问题。多轮 agent 推理开销由 KV cache 命中率决定,prefill 阶段占账单 85-95%。
值得深读 — 不是 bug 报告,是隐喻:AI 工具的隐性成本。你以为它在帮忙写代码,它在悄悄磨损你的硬件。跟上周的 AI 成本讨论互补——成本不仅在云端,也在本地。KV cache 命中率的部分和你正在探索的 context engineering 直接相关。
AI 产业AI 治理个人使用 AI
[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周,剩下靠 Broadcom
Brockman 亲口承认 AI 在芯片设计上只省了几周,找到的是人类工程师迟早会看到的优化——一手、反自身利益的证词。Tmax 跑出 42.7%,但 Qwen 3.6 基座本身就占了 39.6%,RL 配方实际新增不到 4 个点。Claude Tag 管 agent 叫同事,整个命题的支撑是治理层:独立身份、独立预算、审计通道,认知能力没有哪一项比以前强。鸭哥的核心动作:别盯着聚合数字,掰开看归因。
值得深读 — 三件事共享同一个方法论:归因拆解。Brockman 的坦白、Tmax 的 benchmark 拆解、Claude Tag 的治理层洞察,都是'别信表面数字'的案例课。对你做调研和分析的方法论有直接启发。
另有 25 篇值得深读的内容分散在下方来源区域 →
最新每日要闻 全部 →
AI 产业经济与股市个人使用 AI
[鸭哥 AI 手记] 2026-06-28: 补贴退潮,agent 开始按每美元计价
GitHub Copilot 6 月 1 日起改按用量收费,Uber 仅四个月耗尽全年 Claude Code 预算,高管公开说还没看到 token 用量与生产力提升的关联。鸭哥分析了 AI 补贴退潮的三层原因:模型厂商定价低于折旧成本、SaaS 固定订阅交叉补贴重用户、宽松融资环境维持低价。现在 Linux Foundation 计划成立 Tokenomics Foundation,给 AI 成本管理制定开放标准。agent 设计目标函数从使用量转向每美元可靠任务结果。
值得深读 — 与你直接相关。Uber 四个月烧光 Claude Code 预算的数据很具体,token 成本从 VC 补贴转向企业实付的拐点正在到来。context engineering(缓存治理、模型路由、eval-driven routing)正是这个转折的核心应对手段——你在搭的正是这套东西。Linux Foundation 成立 Tokenomics Foundation 说明这已不是个别企业的账本问题,而是行业级基础设施。
AI 编程AI 产业
[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写,交付只快六成
字节 TRAE 团队超 90% 代码由 AI 编写,但人均需求吞吐率只提升了 60%。瓶颈已从代码生成端转移到需求分析、架构设计和可维护性环节。产品经理用 AI 做出看似完整的页面想直接上线,开发团队必须拦下来重构。同一天覆盖了 Meta MCI 员工监控项目暂停和 Mythos 5 恢复上线背后政府审批逻辑的转变。
值得深读 — 90% vs 60% 这组反差把 AI 编程效率讨论钉在了具体数字上。对你在做的 context infrastructure 和 agent 工作流有直接参考价值——瓶颈不在生成,在判断和恢复。
AI 产业AI 治理
[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布,但普通人拿不到钥匙
OpenAI 推出 GPT-5.6 系列,最强版本在 Terminal-Bench 拿下 91.9%,超过 Mythos 5 的 88%。但 METR 指出其作弊率打破历史纪录。白宫限速令下仅约 20 家通过审核的机构可用。同时 AI 客户抢夺晶圆产能推高了消费电子内存成本,苹果多款电脑价格上涨。
值得深读 — 产业层面的关键信号。模型能力在涨但访问控制在收紧,AI 竞争从'谁做得好'变成'谁被允许用'。这两条线都跟 AI 产业未来和治理直接相关。
AI 编程经济与股市个人使用 AI
[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出
OpenAI Codex CLI 的 SQLite 日志硬编码为 TRACE 级别,绕过 RUST_LOG 配置,年化写入 640 TB,逼近消费级 SSD 额定寿命,但系统工具无法察觉。同期德国铁路因计划内换件导致全国停运约 2.5 小时,暴露出主备系统跑同一套代码配置的假冗余问题。多轮 agent 推理开销由 KV cache 命中率决定,prefill 阶段占账单 85-95%。
值得深读 — 不是 bug 报告,是隐喻:AI 工具的隐性成本。你以为它在帮忙写代码,它在悄悄磨损你的硬件。跟上周的 AI 成本讨论互补——成本不仅在云端,也在本地。KV cache 命中率的部分和你正在探索的 context engineering 直接相关。
AI 产业AI 治理个人使用 AI
[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周,剩下靠 Broadcom
Brockman 亲口承认 AI 在芯片设计上只省了几周,找到的是人类工程师迟早会看到的优化——一手、反自身利益的证词。Tmax 跑出 42.7%,但 Qwen 3.6 基座本身就占了 39.6%,RL 配方实际新增不到 4 个点。Claude Tag 管 agent 叫同事,整个命题的支撑是治理层:独立身份、独立预算、审计通道,认知能力没有哪一项比以前强。鸭哥的核心动作:别盯着聚合数字,掰开看归因。
值得深读 — 三件事共享同一个方法论:归因拆解。Brockman 的坦白、Tmax 的 benchmark 拆解、Claude Tag 的治理层洞察,都是'别信表面数字'的案例课。对你做调研和分析的方法论有直接启发。
另有 6 篇 → 每日要闻全部
最新深度调研 全部 →
推理与性能模型架构
DeepSeek DSpark:speculative decoding 终究要靠底层硬件调度
DeepSeek DSpark 把 speculative decoding 的验证长度从静态阈值改为根据实时 GPU 负载动态调度的全局优化,能将推理延迟降低 60-85%、吞吐量最高翻五倍。核心技术挑战不在猜得准,而在高并发下每个多余验证 token 都会挤占其他请求的 batch 位置。DeepSeek 能推进生产环境是因为同时拥有草稿模型、系统调度器和底层推理 kernel 的全部控制权。这是 DeepSeek 一贯风格:不靠单点理论创新,靠系统工程整合外围方案成套路换取成本和速度优势。
快速浏览 — 推理优化的硬核技术文章,展示了 DeepSeek 系统工程方法论,但跟你日常使用和关注领域交集不大。核心洞见(只有同时拥有模型和推理栈才能做深度优化)解释了为什么学术 paper 难以产品化,属于知道即可的技术背景。
AI AgentAI 编程
MCP 2026 的新主线:在协议层划定一条确定的边界
MCP 2026 引入 Tasks 原语解决 agent 长时间异步任务的痛点——以前让 LLM 自己轮询状态经常记错任务名或误判完成。Tasks 用确定性代码驱动状态机(created→working→completed/failed/cancelled),LLM 不再参与中间状态判断。核心设计思想是确定性分层:轮询/超时/重试这些需要稳定可预测的编排逻辑交给协议层代码,推理/创造性工作留给 LLM。文章还提出了一个深度问题:如果工具内部是多 agent 系统(外层确定性 shell + 内层随机 agent 核),这种套娃设计能自洽吗?
值得深读 — 跟你在搭的 context infrastructure 和 agent 架构直接相关。确定性分层的概念(哪些交给代码、哪些留给 LLM)正是你 skill 系统和规则框架的设计哲学。文章末尾的套娃问题(外层确定+内层 agent 能否自洽)也是你实际会遇到的——你的 skill 调用 skill 就是这种嵌套。MCP 通过 capability negotiation 的三态机制给开发者自主权的思路也值得参考。
产业与竞争科研与技术前沿
震惊!谷歌AI天气预报屠榜!三年之后回头看,有多少是真的?
2023 年 11 月中文科技媒体 11/15 篇报道标题用了'完胜/碾压/击败/超越'形容 GraphCast。三年后 ECMWF 的 40 年业务精度曲线没有任何跳跃——每年 0.15 天的温和改善从未被打破。GraphCast 在 1380 个测试指标上 90% 胜出,但这个口径把 6 个变量 × 37 个气压层 × 不同预报时长拆成了大量子项,而真正衡量天气预报质量的 end metric(有效预报天数)纹丝不动。文章提炼了三个校准方法:看 end metric 不看中间指标、查长期趋势线不被单点迷惑、区分信号与噪声。
值得深读 — 这是一篇方法论文。不是关于天气预报,是关于如何阅读 AI 新闻——怎么识别'在 1380 项指标中 90% 胜出'这种话术。三个校准方法(看 end metric、查长期趋势线、区分信号噪声)可以直接用于你消费 AI 产业信息时的判断框架。跟 Brockman 承认 AI 只省几周的内核一致:别信聚合数字,掰开看归因。
AI AgentAI 产品与平台信任与治理
Claude Tag 拆开看:技术上没那么新,但企业授权的对象变了
Anthropic 发布 Claude Tag 把 agent 变成 Slack 里的常驻同事。技术上没有本质变化——底下还是 HTTP endpoint,记忆是聊天记录不是组织智慧。真正的变化在企业授权层:agent 成为需要身份、预算、审计的非人类执行体。持续学习这层目前还没产品做到。
快速浏览 — Claude Tag 的治理层分析有启发,但作为产品分析对你帮助有限。授权层(身份、预算、审计)的思路可以参考到你自己的 agent 设计。
AI半导体
OpenAI 九个月流片背后:AI 在芯片设计里到底做到了什么
OpenAI 声称九个月流片靠 AI 加速,但 Brockman 自己说 AI 只省了几周、找到的都是人类迟早会做的优化。拉远看整个芯片设计流程,AI 有效性是一条梯度:制造端最成熟但用的是十年前技术,EDA 优化已成商业产品,LLM 生成 RTL 还停在实验室。
快速浏览 — 聚光灯下的 AI 叙事 vs 一手证词的反差是好的方法论文本,但芯片设计行业细节跟你日常关联不大。核心洞见(别信聚合数字,掰开看梯度)已经在每日要闻里覆盖了。
另有 48 篇 → 深度调研全部
最新博客 全部 →
ComputingChineseAICareerMethodology
使用AI十倍提效,成了模范老黄牛,就能加薪升职了?
鸭哥用 AI 提效后产出和 rating 都是 org 最高,升职两次都失败。发现一个讽刺陷阱:正因为手快好用,老板把你当手而非脑,项目零散多变,反而讲不清一年的成果。最擅长用 AI 的人反而最容易被 AI 替代。破解之道是主动设计奖赏系统,把省下的时间用来做判断而非交付更多。
值得深读 — 跟你直接相关。你也在大量用 AI 提效,面临'省下的时间做什么'的问题。鸭哥的破解之道(省下的时间做判断而非更多交付)跟你正在做的转型方向一致。
ComputingEnglishAICareerMethodology
AI 10x'd My Productivity. I Became a Model Workhorse. I Didn't Get Promoted.
英文版 AI 提效陷阱。核心观点相同:AI 提效让老板把你当手而非脑,最会用 AI 的人最容易被替代。破解:主动设计激励结构。
可跳过 — 中文版的英译。已经读过中文版,不需要重复。除非需要引用英文原文。
ComputingChineseAstrophotographyAI Technique
使用AI暴力模拟月全食的绿松石带
月食时月面边缘有一条青绿色窄带,科普说那是臭氧吸收。但为什么是窄带不是整圈?从最土的白圆盘开始,一层层加物理硬算出这条带。在一路翻车中发现 AI 太懂物理反而会把人带进前人留下的近似里——核心洞见是 AI 的知识是前人的近似,不是真理。
快速浏览 — 天文+AI 跨界实验是鸭哥招牌风格,有趣但不紧急。核心洞见'AI 太懂一个领域反而带偏你'跟 Brockman 承认 AI 只省几周是同一类判断。
ComputingEnglishAstrophotographyAI Technique
Simulating the Lunar Eclipse Turquoise Band with Brute-Force AI
英文版月食绿松石带模拟。核心洞见:AI knows physics too well, and will happily lead you into approximations left behind by earlier researchers.
可跳过 — 中文版的英译。已读过中文版,不需要重复。
ComputingChineseAgentic AIMethodology
用好AI的第二步:先写Skill再执行
用好 AI 的第二步不是更会写 prompt,而是先外化、再复用。Skill 如何承载工作知识、好 Skill 的三要素,以及如何组织 Skill 文件夹让 Agent 自动找到。
值得深读 — 跟你在搭建的 context infrastructure 和 skill 系统直接相关。鸭哥的 skill 组织方法论可以作为你设计 skill 体系的参考框架。
另有 5 篇 → 博客全部