"不能有拉低效率的纯职业经理人"
— 熵减密使"为了把限额用完 每天人都好累"
— 雷霆输出"建立这个容易 数据治理才是难和关键"
— 治数先锋Karpathy 一份 gist 拿下 5000 star,他说 RAG 是"每次从零重新发现知识"。编译型知识库是更好的答案吗?
↓ 详见 Part III162 条消息,26 位发言者,周末居然不冷清。一位 Meta 员工空降客栈,带来裁员一线的体温——老板不堪重负辞职了,Pod 从三人膨胀到五十人,而扎克伯格说"员工是 AI 的优质饲料"。另一边,Codex 开始倾销——限额还剩一半就被刷新到 99%,烧瓶炼客跑废了一台 MacBook。Anthropic 同日放出创始人行动手册并收购 Stainless,锁住 Agent 时代的接口层。Karpathy 的 LLM Wiki 从早间分享延伸到晚间实战,智源先生已经帮人在建了。
一个 Meta 内部人空降,一场 Codex 倾销战打响,Anthropic 两分钟内连发两招。周末的客栈,比工作日更刺激。
客栈来了熵减密使,第一句话就炸了:"我司直接用裁员加无限 token 来逼员工提升效率,过去五年我的工作时长提升了 100%,工作效率提升三倍。" 更劲爆的在后面——"一小时前我美国老板刚刚不堪重负辞职了",原来十人团队被打散,Pod group lead 要求带 20-50 人(以前最少只有三个人)。他的总结很冷:"不能有拉低效率的纯职业经理人,不能因为稳定而加剧组织熵增。" 但他也给出了反面的解读:每个员工就是自己 Startup 的创始人,投资有公司兜底,改变的是你自己。
几乎同一时刻,求真客丢出一颗炸弹——扎克伯格内部录音流出,标题直白:「员工是 AI 的优质饲料」。有人在琢磨怎么活下来,有人已经开始算"裁员概念股"的买入时机了。
📎 与 5/20 日报「主线 ⑤ 中层消亡论」呼应——那次是月引人的判断"AI Native 组织就是 boss 直管终端",这次熵减密使用亲身经历证实了。
烧瓶炼客周六发了条让人哭笑不得的吐槽:"codex 最近真是疯了,倾销啊,我昨天的限额还有 50% 左右,还没到刷新时间呢,今早起来就直接给我刷新了,现在 99%,根本用不完啊。" 雷霆输出的回复更绝:"真的 为了把限额用完 每天人都好累。" 烧瓶炼客说已经跑报废一个老款 MacBook Pro,现在 Windows 也三天没关机开始卡顿。敏行客一句"本末倒置了"收尾。
一周前大家还在比较 Claude vs Codex 谁更好用,现在 OpenAI 直接开始"倾销"——用量大到用户的硬件先撑不住了。这不是产品竞争,是平台级的定价战。
📎 与 5/20 日报「主线 ④ Claude Code vs Codex 大洗牌」呼应——五天前还在功能比较,现在已经进入"谁先把对方耗死"的倾销阶段。
两分钟内两条分享,拼出 Anthropic 的周末动作。牛津学士转发了 Anthropic 创始人的 AI-Native 创业行动手册(36 页中文 PDF),紧接着烧瓶炼客丢出更重磅的消息——Anthropic 收购 Stainless,一家做 API SDK 自动生成的公司。标题说得明白:"别只盯着应用层。Agent 时代真正稀缺的,是让 AI 能行动的基础设施。"
上周 Karpathy 加入 Anthropic 是人才层面的布局,这周收购 Stainless 是基础设施层面的布局。Anthropic 在锁住 Agent 生态的"接口层"——不是做模型,而是控制 AI 调用外部世界的管道。
📎 与 5/22 日报「主线 ① Anthropic 率先盈利」和 5/20 日报「Karpathy 加入 Anthropic」呼应——从人才到营收到基建,Anthropic 的棋局越来越清晰。
三栖驿马清晨分享了 Karpathy 的 LLM Wiki 文章,金句点睛:"Obsidian 是 IDE,LLM 是程序员,wiki 是代码库。" 核心论点:RAG 让模型每次都"从零重新发现知识",应该在 ingest 时就编译成结构化 wiki。5000+ star、5000+ fork、1600 万次浏览——没开源代码,只开源了想法。
这条分享的影响没停在早间。到了傍晚,智源先生说"不错,我忙了一天的建了"——他已经在帮人搭知识库,下周还有排期。烧瓶炼客笑着说"这不就是我现在在做的嘛",顺手放出了新版网站。治数先锋则泼了盆冷水:"建立这个容易,数据治理才是难和关键。"
📎 与 5/20 日报「主线 ② Karpathy 加入 Anthropic」呼应——人加入了新阵营,思想在社区落地生根。
月引人抛出上周五聚餐的余波:"智源先生提到的观点,巴菲特马云马化腾等的成功都是几代人的托举。" 三栖驿马接话"三代才能出贵族"。月引人点出难点:"很难的点是需要一代一代人接力跑,不能有哪一代躺平掉队。" 智源先生则说自己前几年一直在做的事是把家族文化和传承找回来再教给孩子,"所以家族要多繁衍多布局"。
在 AI 让一切加速的时代,客栈居然聊起了最慢的事——家族传承。快的人在抢接口、抢限额、抢效率,慢的人在攒文化、攒知识、攒下一代。两种节奏,不矛盾。
一句来自 Meta 内部人的冷判断,一句来自 Codex 用户的反讽,一句来自知识库建设者的真话。
「总体来说就是不能有拉低效率的纯职业经理人,不能因为稳定而加剧组织熵增。」
「真的 为了把限额用完 每天人都好累 😂」
「建立这个容易,数据治理才是难和关键。」
5 月 26 日(周一)晚 20:00,Agent-World 第一作者、董冠霆博士将在客栈做深度分享。由三栖驿马预告。这是客栈首次邀请学术界大牛做 Agent 系统设计的专场,值得期待。
—— Karpathy 的 LLM Wiki 凭什么拿下 5000 star?
今年 4 月,Andrej Karpathy 发了一条推文加一份 GitHub gist,标题是《LLM Wiki》。没有代码,只有一份 Markdown 描述。至今 5000+ star、5000+ fork、1600 万次浏览。他的核心主张很简单:大多数人用 LLM 处理知识的方式,从第一步就走错了。
1. RAG 的结构性缺陷:每次提问都是"从零发现",知识没有积累,上下文窗口成了天花板。
2. 编译型知识库的核心差异:知识在 ingest(写入)时就被结构化,不在 query(查询)时才临时拼装。新信息更新已有页面,而非新建索引条目。据 MindStudio 测算,长期使用下 Wiki 模式比 RAG 节省约 95% 的 token 消耗。
3. 实操判断:对于持续使用、反复查询的知识体系,Wiki 模式 ROI 远高于 RAG。但对一次性查询和海量非结构化数据,RAG 仍是最实用的选择。两者不是替代关系,是分层关系。
RAG(Retrieval-Augmented Generation)是过去两年 LLM 应用的主流范式:把文档切块、建向量索引、用户提问时检索相关片段、拼进 prompt。问题出在哪?
Karpathy 的比喻很直接:RAG 就像一个学生,考试前不复习,每次都翻书现找。找到不等于理解,检索不等于知识。
Karpathy 的方案是一个三层概念框架:
raw/ 文件夹新资料进来时,LLM 不是新建索引条目,而是更新已有页面——修正过时结论、标出矛盾点、强化或否定之前的判断。他用了一个精妙的类比:"Obsidian 是 IDE,LLM 是程序员,wiki 是代码库。" 知识管理变成了一个"编译"过程——raw data 是源码,wiki 是编译产物,LLM 是编译器。
RAG vs Wiki 不是技术路线之争,是知识观的分野:
一个投研团队用 RAG 处理 100 份年报,每次提问都可能得到不同的答案,因为检索到的碎片不同。换成 Wiki 模式,第一次处理就把所有公司的财务数据、管理层变动、风险因素编译成结构化实体页,后续查询是在"已理解的知识"上检索,而不是在"原始碎片"中捞鱼。
gist 发布一周内就涌现出大量开源实现:
客栈里也在动手——智源先生忙了一天在建,烧瓶炼客说"这不就是我在做的"。Karpathy 开源的不是工具,是一个思维模型。
Wiki 模式不是万能药。社区讨论中常见的反对意见:
判断:70% 成立——Wiki 模式在中小规模、高频复用的知识体系中会逐渐替代纯 RAG,但两者更可能形成分层架构:底层用 RAG 做"全文检索兜底",上层用 Wiki 做"编译知识优先查询"。
基于 Karpathy 的 LLM Wiki 框架和客栈的实际需求,两个可落地的方向:
Karpathy 这份 gist 的真正价值不在于"RAG 不好"——RAG 在大多数场景下仍然是最务实的选择。真正的洞察是:知识有"编译"和"解释"两种处理模式,而我们过去两年几乎只在用后者。
编译的成本更高,但收益是累积的。解释的成本更低,但每次都从零开始。对于一个社区、一个团队、一个持续积累的知识体系来说,在某个节点从"纯解释"切换到"编译优先",可能是 ROI 最高的基础设施投资。
Karpathy 上个月加入 Anthropic,这个月他的知识管理哲学就在客栈被认真讨论、动手实践。思想不分阵营,好的想法自己会走路。