Visual Digest 2026-06-26~28 · Vol.31 · 三日合刊
💬
108
messages
🎙️
18
voices
🆕
0
new faces
🔬
1
deep dive
基模王座 72h 两洗
3
GPT-5.6 三模齐发
0 token
能不用就别用
CLAUDE.md
上下文入口之争
5 Main Threads
01
"能不用 token 就别用":CLAUDE.md 拆解引发的成本论
6/26 07:53–09:00 · Token 工程
烛火笔吏治数先锋金鉴行家
工程实战
02
Fable 5 "失忆"归来,GPT-5.6 三模齐发
6/26–27 · 基模军备竞赛
月引人烛火笔吏轮辙客
行业地震
03
"模型厂商能力正在向 Harness 层外溢"
6/28 00:01–09:23 · 概念修正
治理先锋智源先生月引人
产业分析
04
"我已经主动把 Anthropic 戒了"
6/28 19:45–20:02 · 工具依赖
烛火笔吏月引人治数先锋
工具哲学
05
Loop Engineering 中译本 + WAIC 组团
6/28 21:43–23:07 · 社群飞轮
百案通达扬帆远行云台指路
社群动力
3 Non-Consensus

"别用skill 写个程序来弄 你这个场景能不用token就别用"

— 治数先锋

"PDF是个对于大模型来说很烂的格式。"

— 金鉴行家

"anthropic其实给人类了很多智慧,这些智慧是它没了,智慧还留存在的"

— 治数先锋
Deep Dive
你戒的不是 Anthropic,是一种已经内化的思维方式

当你说"戒 AI"的时候,你戒的是什么?是一个 API 端点,还是你用了 6 个月才练出来的一套和机器协作的直觉?本期拆认知外包、Prompt 资本和工具依赖的三层关系。

认知外包工具依赖Prompt 资本
↓ 详见 Part III
AGITopia Daily · Volume 31 · 三日合刊

模型的王座每周都在换,
你给它的规则一行都没变

6/26 早上,一篇 CLAUDE.md 拆解文章引发了一场关于"什么时候不该用 AI"的工程讨论。同一天,Fable 5 "失忆"回归,第二天 GPT-5.6 三模齐发,72 小时内基模王座换了两次。6/28 凌晨,有人修正了自己的措辞:"不是模型能力在外溢,是模型厂商能力在外溢。"到了深夜,一个人说"我已经主动把 Anthropic 戒了",另一个人说"智慧还留存在的"。三天 108 条消息,18 位发言者,表面聊的是工具和模型,骨子里在反复确认同一件事:你和 AI 之间的关系,到底是谁依赖谁。

2026·06·26~28  ·  108 条消息  ·  18 位常客发声  ·  5 个核心话题
PART I · 群聊日报

三天里最值得复盘的五件事

按叙事分量排序,不按热度。每件都藏着一个超出当天的判断。

① "能不用 token 就别用":CLAUDE.md 拆解引发的 AI 工程成本论

6/26 早上 7:53,烛火笔吏 分享了"架构师"公众号的一篇文章,标题是《CLAUDE.md 拆解:Agent 进仓库前的上下文入口》。核心论点:"CLAUDE.md 的价值在于启动时注入少量关键上下文,不在于把项目写成百科。好的入口规则通常来自真实失败。" 月引人 08:38 跟了一句:"我一直想找到 Claude.md memory rules 这几个的边界在哪,这篇文章说清楚了。"

与此同时,云台指路 在问如何批量处理 PDF 研报——分析内容、写卡片式 summary、再出图。治数先锋 08:29 给了当天最硬的一刀:"别用 skill 写个程序来弄 你这个场景能不用 token 就别用。" 烛火笔吏 秒回 "exactly"。治数先锋接着拆方案:"自动化部分用程序跑 要识别 出图部分接个 llm,这样最大节约成本还跑的快。" 云台指路领悟了:"那就是前后写成 py,中间接个 llm,然后批量执行。" 烛火笔吏补了个具体落地方向:"这个批量执行用 dify 搭一个 workflow。"

话题随后漂到了 PDF 本身。金鉴行家 08:46 推荐了 MinerU(上海交大开源项目):"PDF 是个对于大模型来说很烂的格式。" 又补了关键细节:"研报里的无边框表格是一般 PDF 转 txt 处理不了的。MinerU 可以保持表格的结构。" 烧瓶炼客 冒出来说他前两天也搞了个类似的:"MinerU 做核心,搭了个三层结构,把 GitHub 上的几个开源程序拼了拼。" 月引人 笑着收尾:"怎么省 token 大家都好有心得哈哈。"

AI 时代最值钱的工程能力,不是写 prompt,是知道什么时候不该用 AI。

② Fable 5 "失忆"归来,GPT-5.6 三模齐发:72 小时基模两洗

6/26 09:59,月引人 分享了量子位的文章《Claude Fable 5 分批重新上线!GPT-5.6 秒跟》,附了一句:"fable 5 回来了。" 烛火笔吏 10:09 只回了两个字:"卧槽。" 但月引人紧接着泼了冷水:"但是男神貌似失忆了,能力还不如 opus 4.8。" 又加了一句:"这两天 cc 很不稳定,应该内部在调试,这会我已经 hit limit 了。"

月引人随后提了一个有意思的思路:"偷梁换柱把 fable 的能力升级给 opus,不是也是个解决方案吗。" 言下之意:用户要的不是一个叫 Fable 的名字,是那个水平的体验。同一天 10:23,月引人又分享了一条消息:"谷歌 Gemini 大模型两名关键成员 Jonas Adler、Alexander Pritzel 计划转投 Anthropic",评价了一句:"A 家真的太强大了。"

第二天 6/27 19:44,轮辙客 丢了另一颗炸弹:《GPT-5.6 突然发布!Fable 5 痛失最强基模王座》,描述 Sol、Terra、Luna 三款模型齐发。轮辙客的评论很真实:"还得是国外。"

基模的王座每周都在换,但换座的速度本身就是最重要的信号:这个市场还没有任何一条护城河是安全的。

📎 与 6/24 日报「主线 ② Opus 会嫉妒 Fable 吗」呼应——那天在聊模型人格选择,三天后人格的载体又换了一轮。

③ "模型厂商能力正在向 Harness 层外溢":凌晨的概念自我修正

6/28 凌晨 00:01,治理先锋 发了一句:"模型能力正在向 harness 层外溢。" 六分钟后,他自己修正了:"这话说的可能不精准,模型厂商能力正在向 harness 层外溢。" 一字之差:从"模型"到"模型厂商",主语从技术变成了组织。

智源先生 00:15 点了个赞,然后补了一个更底层的框架:"其实就是要建立一个控制论闭环系统来搞。" 到了第二天早上 09:19,月引人 回应:"最近对这个机制深有体会。" 紧接着给出了自己的版本:"大模型开始进入工程化路径了,大模型只是一台车的引擎,还需要 harness 和 infra 来配合。"

"模型能力"和"模型厂商能力"之间那一字之差,恰好是从技术讨论升级到产业分析的分水岭。Anthropic 挖人、Google 追赶、OpenAI 三模齐发,外溢的不是参数量,是组织能力。

📎 与 6/16 日报 Deep Dive「Fable 走后 harness 凭什么成了新护城河」呼应——两周前在讨论 harness 作为技术层的价值,现在视角升到了"厂商"层面。

④ "我已经主动把 Anthropic 戒了":工具依赖的一场深夜自白

6/28 晚 19:45,烛火笔吏 分享了一段视频,感叹:"中间那段看的都要跟着一起哭了。" 月引人 接了一句半开玩笑的话:"咱们老了一起去'戒 ai 所'。" 然后追了三条:"等 anthropic 封了咱们的号""咱们就一起哭一场。"

19:56 烛火笔吏说了当天最重的一句话:"我已经主动把 anthropic 戒了。" 治数先锋 19:59 回了一段很有分量的反驳:"为什么要这样说呢?anthropic 其实给人类了很多智慧,这些智慧是它没了,智慧还留存在的。" 月引人解释了烛火笔吏的逻辑:"他是怕被动不让他用,他戒的难受,还不如早点找别的路。"

"戒"这个字本身就暴露了问题的性质:你不会"戒"一个纯工具,你只会戒一个已经改变了你工作方式的东西。但治数先锋的反驳同样精准——知识可以跨工具迁移,你内化的方法论不会因为换了一个 API 就蒸发。

⑤ Loop Engineering 中译本 + WAIC 组团 + 一首小曲

6/28 21:43,百案通达 在群里丢了一份 PDF:"Anthropic 的内部 Loop Engineering 手册解释了智能体如何从一次性提示转向可重复的工作流程。翻译成了中文版本。" 月引人 回了三个 [强]。一份原本只有英文读者能触及的技术文档,被社区成员主动翻译成了中文——这是知识资产的静默积累。

差不多同时,19:59 云台指路 分享了一个温暖的东西:"分享一首我们家女宝创作的旋律所制作的一首小清新纯音乐歌曲。名字和专辑封面的兔子小木屋都是她自己设计的。" 月引人回复"超棒"。一个 AI 社群里,一个孩子的作曲被认真对待。

22:59 月引人问了一句:"waic 大家报了吗?" 扬帆远行 立刻问能不能搞嘉宾票,百案通达"同问"。月引人回:"估计很难,线上可以买票。"

一个人翻译技术手册,三个人商量线下见面,一个孩子的歌被群友夸。社群的价值不在今天的消息条数,在于这些静悄悄累积的知识资产和人际连接。

客栈荐读 群友分享 · 编辑精选
PART II · 被忽略的非共识

三条容易划过去的话

说出口时没几个人理会,但判断力极强的三句话。

"别用 skill 写个程序来弄 你这个场景能不用 token 就别用"

治数先锋,6/26 08:29

所有人都在研究怎么用好 AI,很少有人认真讨论什么时候不该用 AI。这句话不是否定 AI 的价值,是在提醒:分辨任务类型本身就是一种被低估的工程能力。当一个任务的 80% 可以用确定性代码解决,把 100% 都丢给 LLM 不是偷懒,是浪费。省 token 的最好方法不是优化 prompt,是识别出哪些环节根本不需要 LLM。这种分辨力在 AI 工具越来越便宜的今天反而越来越稀缺。

"PDF 是个对于大模型来说很烂的格式。"

金鉴行家,6/26 08:52

PDF 是商业世界的通用语言——研报、合同、白皮书全是 PDF。但它的"通用"是给人类设计的(保真排版),不是给机器设计的。当你把一份研报直接喂给多模态模型,你付的不是"理解内容"的 token,你付的是"解析排版"的 token。金鉴行家推荐的 MinerU 是上海交大开源的 PDF 提取工具,能保持研报中无边框表格的结构。这件事的启示不止于 PDF:在 AI 之前加一道预处理层,把人类格式翻译成机器格式,往往比升级模型更划算。

"anthropic 其实给人类了很多智慧,这些智慧是它没了,智慧还留存在的"

治数先锋,6/28 19:59

当所有人都在讨论"如果 Anthropic 封号怎么办",这句话直接把问题拉到底层:知识和工具是可以分离的。你从 Claude 身上学到的思考方式、工作流设计、prompt 技巧,这些不会因为换了一个模型就消失。这个判断暗示了一个更大的趋势:AI 时代的核心资产不是你用的哪个模型,而是你和 AI 协作过程中内化的方法论。工具可以被封、被停、被取代,但你从使用中沉淀下来的认知模式是真正属于你的。

PART III · Deep Dive

你戒的不是 Anthropic,是一种已经内化的思维方式

AI 工具依赖不是瘾,是认知外包。问题不在用不用,在于你知不知道自己外包了什么。

烛火笔吏"我已经主动把 anthropic 戒了"治数先锋 反驳"智慧还留存在的"。这不是两句闲聊,是两种对"人和 AI 工具之间到底是什么关系"的根本判断。一个认为依赖是风险需要提前切割,一个认为知识已经内化不怕工具消失。哪个更接近现实?本期 Deep Dive 从认知科学出发,拆解 AI 工具依赖的三层结构。

TL;DR

  • 认知外包是真实发生的:你把一部分思维流程交给了 AI,包括措辞、结构化思考、甚至判断力的一部分。这不是"懒",这是大脑的正常策略,心理学叫"认知卸载"。
  • 但外包的是流程,不是知识:你学会了"什么时候该问 AI""怎么验证 AI 的输出""什么样的 prompt 能拿到好结果"——这些元认知技能是工具无关的。治数先锋说"智慧还留存在的",精确到位。
  • 真正的风险不是工具消失,是你不知道自己外包了什么:如果你能清楚列出"哪些事情离了 AI 我做不了",你就安全了,因为你有意识。怕的是无意识外包——以为是自己的能力,其实是 AI 的。

01 "戒"这个动词暴露了什么

烛火笔吏用"戒"来描述放弃 Anthropic 时,他选了一个通常用于烟酒赌博的动词。这个用词不是修辞夸张,它精确地描述了一种心理状态:这个工具已经和你的日常工作流融合到了一定程度,停用会产生可感知的不适。心理学中有一个概念叫"延伸心智"(Extended Mind),由哲学家 Andy Clark 和 David Chalmers 在 1998 年提出[1]。核心论点是:如果一个外部工具稳定地参与你的认知过程,它在功能上就是你心智的一部分。手机里的通讯录是你记忆的延伸,计算器是你算力的延伸。按这个框架,Claude 或 ChatGPT 对重度用户而言,已经不是"工具",而是认知系统的外挂模块。

"戒"的不适感来自这里:你不是在换一个 App,你是在切除一个已经嵌入工作流的认知组件。

02 认知卸载:大脑一直在做的事

把思维负担转移到外部工具上,认知科学家称之为"认知卸载"(Cognitive Offloading)[2]。这不是 AI 时代的新现象——你用纸笔列待办事项、用 GPS 导航、用 Excel 做预算,都是认知卸载。大脑天然倾向于把可外包的认知任务交出去,腾出带宽处理更高阶的判断[3]

AI 工具让认知卸载的范围急剧扩大了。以前你只能卸载记忆(搜索引擎)和计算(计算器),现在你可以卸载措辞(让 AI 润色)、结构化思考(让 AI 列大纲)、甚至初步判断(让 AI 给出方案比较)。JetBrains 和 UC Irvine 的一项联合研究发现,在 800 名开发者的 1.51 亿次 IDE 窗口切换数据中,74% 的 AI 辅助开发者没有意识到自己的工作流切换频率增加了[4]。JetBrains 称之为"隐形摩擦"(stealth friction)——你甚至不知道自己已经在依赖了,更谈不上自我纠正。而 BCG 在 2026 年的一份报告中更直接地指出:"因为 AI 能足够高效地产出看似合理的想法,员工的独立构思能力会萎缩"[5]。超过半数受访领导者说他们已经观察到了这种"分布式去技能化"。

客栈里的对话完美呼应了这个发现。治数先锋"能不用 token 就别用",本质上是一种高阶判断力的体现:他在做的不是"怎么用好 AI",而是"什么时候不该用 AI"。后者才是认知卸载时代真正稀缺的能力。

03 Prompt 资本:一种新型的不可见资产

你花了 6 个月学会了怎么和 Claude 有效协作。你知道它在什么情况下会"偷工减料",什么样的指令结构能拿到最好的结果,什么任务应该拆成多步而不是一步到位。这些知识有一个名字:Prompt 资本。

Prompt 资本的特殊之处在于,它看起来是和特定工具绑定的(我知道 Claude 的脾气),但实际上大部分是工具无关的元认知技能。MindStudio 的一篇分析文章指出[6]"不同模型处理系统提示、用户回合和工具描述的方式各不相同,但一条写得好的 prompt 的意图通常是可迁移的,只要你避免特定模型的格式怪癖。" 目标是"在多个模型上表现足够好的 prompt,而不是在一个模型上完美的 prompt"。

但有一部分 Prompt 资本确实是工具特定的。MindStudio 在另一篇文章中区分了两种知识[7]:显式知识(documented preferences,saved templates)是可移植的;隐式知识(the agent's inferred model of how you operate)是不可移植的——"隐式知识与显式知识的比例随时间推移而增加。" 你用 Claude 越久,被锁定的隐式知识越多。客栈里 6/26 早上的 CLAUDE.md 讨论恰好命中了这个点:CLAUDE.md 本质上是把隐式知识显式化的过程——你在写规则文件时,其实是在将自己的项目理解从"模型才知道"变成"文件里写着"。

04 切换成本:比 SaaS 更高,但不在你以为的地方

传统 SaaS 的切换成本主要是数据迁移和学习曲线。AI 工具的切换成本高在另一个层面:你的工作流和 AI 的特性是共同演化的。你不是在"使用一个工具",你是在和一个工具共同构建了一套工作方式。

月引人"偷梁换柱把 fable 的能力升级给 opus,不是也是个解决方案吗"。这句话的潜台词是:我不在乎模型叫什么名字,我在乎的是体验的连续性。但"体验的连续性"恰恰是最难迁移的部分。Fable 5 回来"失忆了"——模型的参数可以恢复,但它和你之间建立的交互默契回不来。

2026 年 3 月的一篇 arXiv 预印本提出了一个更深层的结构:"委托反馈环"(Delegation Feedback Loop)[8]——AI 能力越强,人类委托越多;委托越多,练习越少;练习越少,越需要委托。论文数据显示,AI 上下文窗口从 2017 年的 512 tokens 增长到 2026 年的 200 万 tokens(约 3906 倍),而同期人类的有效上下文跨度(ECS)从约 16000 tokens 下降到约 1800 tokens。切换成本不只是"换工具的麻烦",它和认知能力的结构性退化绑在一起。

05 反论:知识是可迁移的

治数先锋"智慧还留存在的",这个判断有认知科学的支撑。一项发表在 International Journal of Human-Computer Interaction 上的研究提出了"协作式 AI 元认知"(Collaborative AI Metacognition)框架[9],指出生成式 AI 对用户提出了独特的元认知要求——"用户需要评估 AI 产出的相关性、完整性和准确性,而这些产出可能看起来流畅且权威,无论其实际质量如何。" 研究建议:提升人机协作的干预措施不应只教人写更好的 prompt,更应培养他们批判性评估 AI 输出的能力。这种元认知能力一旦形成,就是工具无关的。

这和月引人在 6/28 说的"大模型只是一台车的引擎,还需要 harness 和 infra 来配合"形成了一个有趣的对称:如果模型是引擎,那用户自己就是驾驶员。引擎可以换,但驾驶技术不会因为换了一台车就消失。CLAUDE.md 的价值正在于此:它不只是给 AI 读的规则,它是你把自己的驾驶偏好写成了可移植的文件。

06 真正应该担心的是什么

不是"戒了 AI 我还能不能工作",而是"我有没有意识到哪些能力已经被外包了"。

认知卸载的风险不在于卸载本身,在于无意识卸载。Nature 在 2026 年报道[10],引入 AI 辅助三个月后,临床医生在没有 AI 帮助的情况下检测肿瘤的能力下降了 6%。研究者将其归因为"对 AI 工具的持续接触可能导致临床医生在没有 AI 辅助做认知决策时,动力更低、注意力更差、责任感更弱。" 如果你清楚知道"我把初稿生成交给了 AI,但终稿判断是我自己做的",你就是有意识地使用工具。如果你已经不记得上次不靠 AI 从零写一篇文章是什么感觉,你可能正在经历同样的无意识退化。

客栈里的对话揭示了一个健康信号:这个社群的成员在主动区分"什么该用 AI""什么不该用"。治数先锋的"能不用 token 就别用"、金鉴行家的"PDF 是对大模型来说很烂的格式"——这些判断本身就是"我知道我在外包什么"的证据。

核心反直觉

AI 依赖者和 AI 高手之间的区别,不在于使用时长或花费的 token 数,在于是否能回答这个问题:"如果明天所有 AI 工具同时消失,我的工作中有多少比例会停摆?" 能回答得越精确,说明你的外包越有意识——有意识的外包不是依赖,是杠杆。

可执行判断

做一次"认知外包审计":列出你过去一周用 AI 完成的所有任务,标记哪些你能独立完成(只是更慢),哪些你已经不会了。后者就是你的风险敞口,前者是你的合法杠杆。如果风险敞口的比例让你意外——多到自己不舒服,考虑定期做一次"无 AI 日"来维持基线能力。

最后一段

三天的客栈对话,表面看是模型换代、工具争论、社群活动。但底层只有一个问题反复出现:你和 AI 的关系里,哪部分是你的,哪部分是它的?治数先锋"能不用就别用"是在划边界,治理先锋"模型厂商能力外溢"是在看趋势,烛火笔吏"戒了"是在做压力测试,治数先锋"智慧还留存在的"是在给出答案。

答案可能没那么悲观。你花在 AI 上的时间不是沉没成本,它沉淀成了一种新的元认知能力——知道什么该问、什么不该问、什么答案可信、什么答案需要验证。这种能力比任何一个模型都更耐用。

但 Nature 那篇研究[10]也在提醒:元认知资产有折旧期。三个月不做独立诊断,医生的准确率就下降 6%。CLAUDE.md 写的是规则,长进去的是判断力,可判断力也需要练习来维持。你现在有多久没在不开 AI 的情况下从零写过一篇东西了?

References

  1. Clark, A. & Chalmers, D. (1998). "The Extended Mind." Analysis, 58(1), 7-19. 另见 Clark 2025 年访谈:dropbox.com
  2. Risko, E.F. & Gilbert, S.J. (2016). "Cognitive Offloading." Trends in Cognitive Sciences, 20(9), 676-688. doi.org
  3. Sparrow, B., Liu, J. & Wegner, D.M. (2011). "Google Effects on Memory." Science, 333(6043), 776-778. doi.org
  4. JetBrains & UC Irvine (2026). "AI Tool Switching is Stealth Friction." blog.jetbrains.com
  5. BCG (2026). "When Everyone Uses AI, Companies Risk Critical Skills." bcg.com
  6. MindStudio (2026). "Tool-Agnostic AI Agent Stack." mindstudio.ai
  7. MindStudio (2026). "What is Behavioral Lock-In?" mindstudio.ai
  8. "The Cognitive Divergence: AI Context Windows, Human Attention Decline, and the Delegation Feedback Loop." arXiv preprint (2026). arxiv.org(未经同行评审,数据需谨慎引用)
  9. Collaborative AI Metacognition Scales. International Journal of Human-Computer Interaction (2025). tandfonline.com
  10. Nature (2026). "Reliance on AI tools degrades the abilities of physicians and software engineers." nature.com
悬赏令 · Vol.31

Vol.30 悬赏回顾:上期问的是"偏好回传的具体操作细节"。这三天没有人直接回应,但 CLAUDE.md 的讨论间接给出了一个方向:把老板的修改偏好写进 CLAUDE.md 式的规则文件,让 AI 在启动时就加载。这算不算偏好回传?留给下一期继续追踪。

Vol.31 新题烛火笔吏说"主动戒了 Anthropic",治数先锋说"智慧还留存在的"。你同意哪边?更具体地说:你在 AI 上花的时间,有多少比例变成了你自己的能力,有多少比例只是对特定工具的依赖? 下期等你的比例估算和自测方法。

← 回到首页
AGITopia Daily · 2026·06·26~28 · For Tavern Regulars Only