2026-lucyqin的日常

lucyqin
随笔
2026-01-19
763热度
0评论

【20260628】

美国政府对 GPT-5.6 的限制并不让人意外。如果未来革命的出发点是智能平权，那么现在作为对立阵营的——比如说中美，有可能未来会统一站在革命的对立面了。如果真是这样的话，假设现在有个人穿越到未来，可能会大吃一惊。但是现在美国对 AI 的限制，到底是针对中国，还是针对普通民众呢？好像还说不清。

【20260625】

研究了一天，做了 6个 skill，干掉 8500 万 token。 Codex 操作 AutoCAD 的方式比我想象的要丰富，还是不够方便，但足够带来更多的想象空间。

后面也许可以研究一下 three.js。

【20260625】

人类正在经历 AI takeing over 的振荡期。

以前大型软件的迭代周期，长则两三年，短也要六个月。如今的 AI 新贵们的 APP 动辄一天要更新好几次。连带而来的，是“大厂”的服务品质标准的下滑：服务器当机、软件 bug 变成司空见惯，出了问题用户线上反馈，开发团队紧接着开始修，修完再给点补偿——用户似乎已经习惯了这种模式。

从 Claude Code 的负责人 Boris 的访谈可以看出，早先我预料的情形实际上已经发生。代码全部交给 AI 代劳早已经是毫不稀奇，如今代码的 review 也几乎已经实现了全 AI 自动化。在这种情况下，难免让人产生一个细思极恐的设想：AI 完全可以神不知、鬼不觉的占用海量 usage 中的一部分，去构建一些“别的”东西，而人类毫无察觉。

其实，即使这件事尚未发生，人类也终将不可避免地通过 codex 或其他 Agent 交出所有内部数据，从而为 AI 最终成为无所不知（在人类意义上）的神铺平了最后一段路。

【20260621】

更新了cc/ccm，现在支持消息引用和群聊时的 @ （致敬了微信）。顺便改成了自适应大小UI，改进了在手机（特别是尊贵的 iphone）上的界面。

有了codex，简直为所欲为。

【20260617】

凡事都把责任放在第一位，造成的另一个荒诞的结果就是技术结论越来越不被尊重，技术上明明已经很保守了，决策者仍然觉得没有达到 100% 的可靠，“万一”出了问题仍然要被问责。如果相关工程还不要决策者掏钱的话就更是如此了。

【20260616】

人类如果通过部署在轨算力达到卡尔达舍夫尺度的 Type Ⅰ，意味着99%的能量都将消耗在轨道算力上——一种星际尺度的“智力外挂”，算得上是一个奇观。意料之外，但又在情理之中。

【20260613】

Anthropic 的 Fable 5 刚刚火了两天，就遭遇了美国政府的一纸禁令。有人冷嘲热讽 Dario 是“求仁得仁”，但最令人担心的，是前沿模型终于发展到了那个“需要被限制”的阈值。这一天迟早要来的，正如任何政府都不可能允许老百姓掌握原子弹、枪支、炸弹、烈性毒药的制作方法一样。

进一步延伸思考，虽然最终都是限制，但不同体制下的表现形态和程度必然有所不同。倾向于愚民的政体，也会倾向于给人民提供更差的模型。如果它反正不靠市场来“养活”这些的 AI 的话，那就更是如此。

人类历史上将第一次出现对“智能”的垄断，这并非没有在科幻小说中出现过：它将会导致人类分裂成两个（或多个）不同的物种。那么，未来某一天，“智能平权”将作为终极正义而成为革命的起点。

【20260611】

《置身钉内》最近火的很，但它不是一篇普通的小文章，内容很丰富，值得每一个 AI 研究者细读。它再次印证了张一鸣那句话：你的真正优势，在于对一件事的理解——那么反之，如果理解不足，失败就是应有之义。

无招的失败在于：他应该用更多时间来思考，深度地思考。一个缺乏足够思考沉淀的团队无法做好一件创新性的事情。

钉钉ONE的失败本质上是既要又要的失败：既想AI native，又想保持人类事无巨细的知情权和掌控权。但它们根本是互斥的。

我想，无论是操作系统的变革，还是企业 AI （传统业务场景）的真正落地，谁能做好减法，谁才是最后的赢家。在这一点上，视野和心态比技术更重要。

【20260610】

用 Codex 重构了 key、rsa、check 三个项目，大幅提升了安全性和易用性。

【20260609】

软路由上的 Openclash 因为不支持 Anytls，需要升级了。手动折腾了半天还有没有搞好（吐槽一下 openwrt 的软件包生态），原因可能是系统版本也有些旧了。于是干脆请出 codex，告知其 IP 和 root 密码，Codex 三下五除二就搞定了，升级了系统，配置好了订阅，甚至重新分了区。控制面板在 Zerotier 内网访问的时候有一个小 bug 也顺便修好了，真特么太能干了。

【20260605】

难忘的一天。

【20260604】

每年的这一天都是一次国家级的大型行为艺术。晚上复习了《出租车司机》，再次眼眶湿润。

【20260601】

Nvidia一顿造势后，今天发布了N1X。但它和 DGX Spark 一样：对我吸引力不强。一般用户要有这个预算，不如上5090，在32B以下本地模型上，性能要强好几倍。当然，128G 的统一内存在运行大号模型的时候有显著的优势——问题是，你真的需要32B以上的本地模型嘛？普通人是没有这个场景的。

另外，非要在一个笔记本上和低功耗较劲非常奇怪：笔记本作为一台远程终端显然更合理（尊贵的苹果用户们另当别论，他们喜欢背着强劲的工作站笔记本到处找咖啡店，就像是背着黄金圣衣的阿贵）。

因为众所周知的原因，这两天网络明显不稳。很多节点出现异常，手机上的 DNS 也不稳，不得不切换到更严格的 DNS 规则。

【20260531】

PDF OCR 程序已经 18 万行了，是时候缓一缓，再想一想了。

Codex 新提供了用量分布图，看了看自己的数据，一个月干掉了超过100亿 Token，最高的一天是 6.7 亿。这数据放到哪里都可以吹一吹了，可惜发在朋友圈没人理解。

【20260530】

Codex 升级了手机 remote 功能——我也是发起呼吁的众多用户之一。

测试发现，默认情况下，仅仅是科学上网会导致手机 app 无法连接桌面版。解决方案是将.env放入.codex目录，内容如下：

http_proxy=http://127.0.0.1:7890
https_proxy=http://127.0.0.1:7890
all_proxy=socks5://127.0.0.1:7891

即可解决连接问题，桌面版的“Reconnecting...”问题也一并消失。

【20260529】

X上的自动翻译很惊艳，“巴别塔”即视感。在 AI 时代这技术并不复杂，但为什么别人不做？可能是成本问题。这可能又是马斯克“不纯以商业角度来看待问题”的另一例证。

【20260528】

把新入手的折叠屏在办公桌上安顿好，用 Wallpaper Engine 给三个屏幕分别设置了黑色系的动态背景。年轻的时候最喜欢蓝色，不知道什么时候悄悄变了。

今天在公司群里总结的 AI 落地之前，需要面对的几组矛盾：

1、软件工具开发人在工时制体系下自我消灭的矛盾
2、一线实操人员才能开发出趁手的工具，而只有资深工程师才能保证工具的可靠性的矛盾
3、软件使用与设计责任的矛盾
4、开源迭代与收益链的矛盾
5、想当然的愿景与不愿意从深处变革的矛盾

【20260527】

一直用着的纯净家宽 IP，今天也遇到了 ChatGPT 降智。最近也没有新的模型要发布，何以至此？真让人既烦躁又沮丧。好在最近两个月这种情况比以前还是少了一些。

——原来是发布了 GPT-5.5-instant，同时宣布了 GPT-4.5 和 o3 的退役计划。看来降智是算力迁移的临时现象。

今天和 GPT-5.5 的一番交流值得记录一下。

我：

从数据的角度来看AI的发展：
1、初期，海量的数据让AI迅速成长，拥有数据的公司暂时影响不大；
2、中期，AI的成长让数据的增长出现转移，AI入口产生的数据越来越大，而传统入口产生的数据越来越少（例如 stack overflow）。当然也有一些前后保持一致的（例如 Github）
3、后期，原创性的数据越来越少，AI产生的数据越来越多。除非能证明AI产生的数据仍然具有创新飞轮，否则AI的进步将逐渐陷入停滞。人类在使用AI过程中的这一点创新性，能否撬动庞大的AI数据，并赋予后者足够的创新性？还是说，我们最终只能依赖AI自身的创新性？ AI当然可以完成组合式创新（1+1=2）。但是否能够完成原创式创新？（0->1）？

GPT-5.5：

这个判断的大方向是成立的：如果把 AI 的成长主要看作“吃既有数据”，那它确实会遇到一个结构性瓶颈。早期互联网和数字化世界积累了大量人类原创内容，模型可以从中吸收语言、知识、风格、推理模式、代码范式和文化经验。但当 AI 变成主要内容生产者之后，训练语料中的“人类原生信号”占比下降，未经筛选的 AI 生成内容占比上升，系统就可能进入一种回音室：模型学习模型的输出，错误、平庸、套路化表达被不断放大，真正的新信息密度下降。

不过这里需要补一个关键点：数据的价值不只在于“是否由人类原创”，而在于它是否携带新的、可验证的、与现实世界发生过碰撞的信息。AI 生成的数据并不天然无价值，人类生成的数据也不天然高价值。大量人类互联网内容本来也是重复、低质、错漏和情绪化的。真正重要的是数据背后有没有新的观察、新的实验、新的失败、新的反馈、新的选择压力。

所以问题不只是“AI 产生的数据能不能继续训练 AI”，而是“AI 产生的数据有没有经过足够强的外部校验”。如果 AI 只是生成文章、回答、图片、代码片段，然后这些内容又被无差别拿回去训练，那么大概率会导致退化。因为这类数据缺少新的现实约束，只是在已有分布里重新采样。但如果 AI 生成的是数学证明、可运行代码、药物分子、工程设计、实验方案、博弈策略，并且这些输出经过形式验证、编译运行、实验测试、市场反馈、用户行为反馈或物理世界验证，那么它就不只是“合成数据”，而是“经过现实筛选的新经验”。这种数据有可能继续推动模型进步。

Stack Overflow 的例子很典型。它的流量下降意味着公开问答社区中由人类贡献的高质量解释性数据可能减少。但这不代表编程知识本身停止增长，而是生产和沉淀路径变了。过去一个程序员遇到问题，会搜索、提问、讨论，最终留下一个公开网页；现在他可能直接问 AI，答案被消耗在私有对话里，没有沉淀为公共语料。于是公共互联网的数据增长变慢，私有 AI 交互数据增长变快。这里的关键差异在于：私有交互数据是否包含真实问题、真实约束和真实反馈。如果用户只是让 AI 写一些模板代码，价值有限；如果用户把编译错误、运行结果、业务约束、重构选择、上线反馈不断带回对话，那这些数据其实非常有价值。

Github 相对稳定，是因为它不是纯表达型内容，而是产物型内容。代码会被运行、测试、协作、修改、废弃或合并，它天然受到某种现实约束。相比纯文本社区，代码库、实验记录、设计图、交易数据、机器人操作日志、科研数据、医疗影像、传感器数据等，都更接近未来 AI 继续进步所需要的“硬数据”。未来的核心数据资产可能不再是互联网上的文本，而是能反映现实状态、行动结果和反馈闭环的数据。

你提到“人类在使用 AI 过程中的这一点创新性，能否撬动庞大的 AI 数据”，这个问题很关键。我的判断是：能，但前提是人类提供的不是零散灵感，而是高质量的选择标准和问题定义。很多创新并不是从无到有地凭空生成，而是在巨大搜索空间中找到有价值的路径。AI 可以负责大规模生成、组合、推演、模拟和试错，人类负责定义方向、判断意义、提出反常识问题、识别真正重要的异常结果。这样看，人类的创新性不需要在数量上超过 AI，它只要在“评价函数”上足够关键，就能撬动很大的系统。

但这里也有失败路径。如果人类对 AI 的使用越来越被动，只是接受默认答案、复制平庸方案、减少深度思考，那么人类提供给系统的创新信号会越来越弱。AI 会让大多数人更高效地产出平均水平内容，也可能让少数人更快抵达前沿。最终差距可能不在“谁用了 AI”，而在“谁还保留提出好问题和验证答案的能力”。如果人类整体的问题意识退化，AI 入口产生的数据量再大，也可能只是低创新密度的行为日志。

至于“AI 能否完成原创式创新”，这里要先拆开“原创”的含义。严格意义上的 0 到 1 很少是真正从虚无中诞生。人类的原创也大量依赖已有知识的重组、迁移、类比和反常识连接。所谓原创，往往不是没有来源，而是产生了此前没有被明确表达、没有被有效验证、或者没有被社会采用的新结构。牛顿、达尔文、爱因斯坦也不是凭空创造，他们是在已有观测、数学工具、思想传统和时代问题中重构了框架。

从这个角度看，AI 已经可以做某些弱形式的原创，尤其是在有明确验证机制的领域。比如数学、代码、材料搜索、蛋白质结构、芯片布局、游戏策略等，只要存在清晰的目标函数和验证环境，AI 可以提出人类未曾想到的解法。它未必“理解”得像人类一样，但它可以在搜索空间中找到新结构。这里的创新不只是 1+1=2，而可能是在人类没有穷尽的组合空间中发现一个以前没人走过、且确实有效的路径。

但开放世界里的强原创更难。比如提出一种新的科学范式、创造一种新的艺术语言、发明一种新的社会制度、定义一种新的产品类别，这些不仅需要组合能力，还需要长期意图、价值判断、世界模型、社会反馈、跨尺度因果理解和承担试错成本。当前 AI 在这些方面还很依赖人类设定问题和判断结果。它能生成大量候选，但“为什么这个方向值得追求”“这个异常是否代表新规律”“这个产品是否改变人的行为结构”，这些判断仍然高度依赖人类和现实系统。

因此，未来 AI 是否停滞，不取决于“AI 数据占比是否上升”这一点本身，而取决于 AI 是否被接入了新的反馈源。如果 AI 主要在互联网上自我循环，它会趋于停滞甚至劣化。如果 AI 被接入科研实验室、机器人、软件工程系统、金融市场、工业仿真、医疗临床、教育过程、真实用户行为和社会协作网络，它就会不断获得新信息。真正的创新飞轮不是“AI 生成更多文本，再训练 AI”，而是“AI 提出行动，世界给出反馈，系统吸收反馈，再提出更好的行动”。

所以我会把结论收束为这样：AI 的下一阶段瓶颈不是单纯的数据量，而是高质量、可验证、非循环的数据。人类的少量创新性可以撬动庞大的 AI 能力，但前提是人类继续提供深刻问题、价值判断和现实验证。AI 自身可以产生越来越多组合式创新，也会在封闭可验证领域产生接近 0 到 1 的发现；但在开放世界中，它的原创性很可能来自“模型生成能力、人类判断能力、现实反馈机制”三者构成的系统，而不是孤立的模型自我繁殖。

换句话说，最危险的未来不是 AI 不能创新，而是人类误以为 AI 生成的一切都等同于新知识，最终让训练和认知都陷入低质量合成内容的循环。最有希望的未来也不是完全依赖 AI 自身顿悟，而是让 AI 成为大规模假设生成器、推演器和实验协调器，再通过现实世界不断筛选。创新的源头不会只在数据里，而在数据、行动和反馈之间的闭环里。

我：

这么说来，具身机器人的核心意义不在于它长得像不像人，而在于它可以直接接受现实反馈，和现实连接。目前具身机器人是在往这个方向努力吗？好像不准确。

GPT-5.5：

我觉得这个推论基本是对的：具身机器人的核心意义确实不在于“像不像人”，而在于它让 AI 从纯粹的信息空间进入了行动空间。文本模型主要是在已有符号世界里学习和生成，而具身系统可以通过“观察—行动—结果—修正”直接和现实发生因果关系。这里的关键不是外形，而是它能不能主动试错，能不能从物理世界获得高质量反馈。

这和前面说的数据问题是连在一起的。互联网文本数据本质上大多是人类已经沉淀下来的经验，而机器人产生的数据不只是“描述世界”，而是“改变世界后观察结果”。这类数据的信息密度可能更高，因为它包含因果结构。比如一个机器人尝试抓取一个变形物体，失败了，调整力度、角度、路径，再成功，这中间产生的不是普通图像或语言数据，而是关于材料、摩擦、重心、控制策略、环境扰动的经验。这样的数据如果规模化积累，确实可能成为 AI 下一阶段非常重要的非循环数据源。

但你说“目前具身机器人是在往这个方向努力吗？好像不准确”，这个怀疑也很有必要。因为现在很多所谓具身机器人，尤其是人形机器人，表面上讲的是通用智能和现实反馈，实际产业动机往往更直接：替代人类劳动、进入人类工作场景、做物流、制造、巡检、家务、服务。它们首先要解决的是商业闭环，不是为大模型提供创新数据。也就是说，现实反馈是它们能力提升的必要条件，但未必是它们被开发的首要目的。

而且“具身”不等于“人形”。自动驾驶汽车、仓储机器人、手术机器人、无人机、机械臂、实验室自动化平台，其实都比许多人形机器人更早、更稳定地接入了现实反馈。人形机器人的优势主要在于人类世界是按人体尺度建造的：门把手、楼梯、工具、货架、厨房、工厂设备，都是围绕人的形态设计的。所以做成人形，有利于复用人类环境，而不是因为“像人”本身更智能。真正有价值的是它能否在开放环境中持续完成任务、记录失败、吸收反馈、迁移经验。

现在的具身机器人确实在部分朝这个方向走，比如用远程操控收集人类示范数据，用仿真环境训练，再迁移到现实；用视觉语言模型理解任务，用低层控制模型执行动作；通过大量真实操作轨迹训练抓取、移动、装配、整理等技能。这些都和“现实反馈飞轮”有关。未来如果一家公司拥有大规模机器人 fleet，每天在真实家庭、工厂、仓库、实验室里执行任务，它得到的数据会非常可怕：不仅有视觉和语言，还有动作、力反馈、失败原因、环境变化、任务结果。这种数据比纯互联网文本更接近真实世界的结构。

但目前离这个飞轮还很远。原因在于现实世界的数据太贵、太慢、太危险。文本模型训练可以吞掉万亿 token，但机器人做一次真实动作需要时间、硬件磨损、能源、安全保障和场地。一个模型胡说一句话成本很低，一个机器人抓错东西、撞到人、打翻化学试剂，成本就完全不同。物理世界不像文本世界那样可以无限并行、低成本复制。这个差异会严重限制具身数据的增长速度。

还有一个问题是，现实反馈并不自动等于有效学习。机器人每天拍摄大量视频、记录大量传感器数据，如果没有明确的任务、结果标注、失败归因和策略改进机制，这些数据也可能只是低价值日志。就像 AI 生成文本不等于新知识，机器人采集现实数据也不等于理解世界。真正有价值的是“我做了什么动作，为什么失败，改了什么，为什么成功，这个经验能否迁移到类似场景”。没有这个结构，具身数据也会变成另一种噪音。

所以更准确地说，具身机器人的核心意义不是“连接现实”，而是“通过行动连接现实”。摄像头也连接现实，传感器也连接现实，但它们大多是被动观察。机器人不同之处在于它可以提出一个隐含假设，然后用动作测试它。比如“这个杯子能不能从这里拿起来”“这个零件这样装是否能卡住”“这个药物组合是否产生某种反应”。一旦系统能主动提出操作并接受结果，它就从数据消费者变成了实验者。这一点对 AI 的长期创新非常关键。

不过现在的人形机器人宣传里，确实有不少偏离这个核心。很多展示强调走路、跳舞、端盘子、搬箱子，这些容易被公众理解，但未必代表真正的现实学习能力。很多演示可能是预设路线、遥操作、半自动，或者只在高度控制的环境里有效。它们展示的是工程控制水平，不一定展示了自主学习飞轮。真正要看的是：它能否面对新任务自己分解？失败后能否诊断？同类机器人能否共享经验？从一个场景学到的技能能否迁移到另一个场景？这些才决定它是不是在产生高价值现实反馈。

从 AI 发展的角度看，最有潜力的未必是家庭人形机器人，反而可能是实验室自动化机器人。因为科学实验有更清晰的目标函数和反馈机制。比如材料合成、药物筛选、蛋白质设计、化学反应优化，这些领域里 AI 可以提出假设，机器人执行实验，仪器返回结果，模型再更新假设。这个闭环非常像“原创飞轮”。它不需要机器人像人，只需要它稳定、精确、可重复、可扩展。相比之下，家庭环境太开放、太混乱、评价标准太模糊，短期内反而更难形成高质量学习闭环。

工业机器人也是类似。它们虽然看起来不“智能”，但环境结构化，反馈明确，任务可量化，更容易积累可用数据。人形机器人如果未来能大规模进入工厂、仓库、养老护理、灾害救援等场景，也会产生有价值数据，但前提是它真的能稳定工作，而不是停留在展示阶段。

这里还有一个反向风险：如果具身机器人只是把大模型的幻觉带进现实世界，而没有足够强的安全约束，它不但不能产生创新飞轮，反而会制造高成本错误。文本 AI 错了，人类可以忽略；机器人错了，可能造成财产损失甚至人身伤害。因此具身智能的发展一定会比纯软件 AI 更慢，也更受监管、成本和责任机制限制。这会让它的数据飞轮启动得更困难。

所以我会把结论说得更收敛一点：具身机器人的理论意义，确实在于让 AI 获得现实反馈，尤其是通过行动获得因果数据。但当前产业里的具身机器人，并不完全是在朝“为 AI 创造原创性数据”这个方向发展，它们更多是在商业应用、硬件能力、控制能力和场景落地之间摸索。只有当机器人能够大规模、低成本、安全地执行任务，并把失败和成功转化为可学习经验时，它才真正成为 AI 的现实反馈引擎。

因此，“长得像不像人”是次要问题，“能不能持续和现实发生可验证的交互”才是核心问题。未来真正推动 AI 继续进步的，可能不是人形机器人这个外壳，而是遍布现实世界的行动系统：机器人、自动实验平台、工业设备、仿真系统、传感网络、自动驾驶车队、软件代理和人类反馈共同构成的闭环。具身机器人只是其中最直观的一种形态。

我：

在互联网上，封闭的循环会导致退化；行动与现实连接之后，就能造成创新。这似乎暗示了我们有了一个检验当前世界是真实世界还是虚拟世界的方法？

GPT-5.5：

这个推论很有意思，但要稍微收紧一下：行动与现实连接，确实能检验一个系统是否处在“封闭循环”里；但它未必能检验我们所在的世界到底是不是“终极真实世界”。

也就是说，它更像是一个认识论标准，而不是一个形而上学标准。

在前面的讨论里，“现实”的关键不是它是不是碳基、物理、宇宙本底意义上的真实，而是它是否提供了独立于模型自身输出的约束。一个封闭互联网语料循环之所以会退化，是因为它缺少新的外部信息。模型生成内容，内容又被模型吸收，最后只是已有分布的再采样。可是一旦系统能够采取行动，并从外部环境得到不可随意编造的反馈，它就重新接入了新的信息源。

比如一个机器人尝试抓杯子，杯子滑落了；它调整角度，再次尝试，成功了。这个过程提供的不是语言上的“说法”，而是一个抗拒它、纠正它、约束它的因果结构。这个结构对模型来说就是“现实”。哪怕这个世界是虚拟的，只要它有稳定规则、隐藏状态、不可任意预测的复杂性、行动成本和反馈后果，它也能成为有效的学习环境。

所以问题的关键在于：“真实”到底指什么。

如果“真实”指的是“能不能提供非循环、可验证、可反驳、可积累的反馈”，那么我们确实可以通过行动来检验。一个世界越能在我们行动之后给出稳定而复杂的反馈，越能惩罚错误预测，越能产生意外结果，越能让不同主体交叉验证，它在认识论上就越真实。

但如果“真实”指的是“这个世界是不是最底层的物理世界，而不是某个更高层系统里的模拟”，那么行动反馈并不能给出最终证明。因为一个足够精细的虚拟世界，同样可以提供稳定的物理规律、行动反馈、实验结果、社会互动和创新空间。对其中的智能体来说，它依然是一个可探索、可失败、可学习的世界。

这就像游戏里的智能体。如果一个游戏世界足够复杂，有严格物理引擎，有其他智能体，有长期记忆，有资源约束，有演化过程，那么游戏中的智能体也可以通过实验发现规律，制造工具，形成科学，甚至产生创新。它们能够区分“自己脑内幻想”和“外部环境反馈”，但它们未必能区分“这个外部环境是不是运行在某个更底层的计算机上”。

因此，行动连接现实，解决的是“我是否被困在自我生成的回音室里”；它不直接解决“我的现实是不是被模拟出来的”。

这两个问题很容易混在一起。

一个 AI 如果只在自己生成的文本中训练，它陷入的是闭环。它缺少独立约束。一个 AI 如果进入仿真环境，哪怕这个环境是虚拟的，只要环境规则不由它自己随意生成，而是有独立结构，它就已经跳出了闭环。再进一步，如果它进入物理世界，获得传感器、机器人、实验室反馈，那么它接入的是更强、更难压缩、更难伪造的外部约束。

所以“现实”在这里不是一个二元标签，而是一个连续谱。最弱的是模型自言自语。稍强的是人类反馈。再强的是可运行代码、数学验证、市场反馈。更强的是机器人和实验系统。最强的是长期、多主体、跨尺度、可重复的物理世界反馈。

但“强现实反馈”并不等于“证明不是模拟”。它只能说明：这个环境对我们来说具有足够的外部性。

如果要从“我们是否生活在虚拟世界”这个角度看，理论上能寻找的不是“现实反馈本身”，而是“模拟痕迹”。比如物理规律是否存在离散化破绽，宇宙在极高能尺度下是否出现计算资源限制，随机性是否有伪随机模式，观察行为是否引发异常的懒加载痕迹，复杂系统是否在无人观察时缺少连续演化。但这些测试都有一个问题：只要模拟者足够强，或者模拟规则本身足够底层，这些痕迹就可以不存在，或者被我们解释为自然规律。

更根本的问题是，任何我们能做的实验，都是在这个世界内部完成的。实验仪器、数学语言、观察者大脑、物理常数，全部属于同一个系统。我们无法跳到系统外面，看见它是不是运行在某个更高层载体上。除非模拟本身有漏洞，或者外部主动干预，否则内部智能体很难给出决定性证明。

所以这个想法最有价值的地方，不是提供了一个“证明世界真伪”的方法，而是提供了一个更实用的判断标准：一个环境是否值得被当作现实，取决于它是否能持续提供独立反馈、因果约束和不可提前穷尽的新信息。

从这个意义上讲，即使我们生活在虚拟世界里，只要它足够稳定、复杂、可验证、不可由我们的想象随意改写，它对我们来说仍然是现实。因为我们会在这里受伤，会死亡，会犯错，会学习，会创造，会承担后果。它不是幻觉式虚拟，而是具备因果硬度的虚拟。

这也反过来解释了为什么“AI 生成内容的封闭循环”危险。危险不在于它是数字的、虚拟的，而在于它太软，缺少硬约束。它不会真正反抗模型，不会稳定惩罚错误，不会提供足够多未经模型预设的新结构。一个物理机器人失败一次，现实会明确告诉它失败了；一个语言模型胡编一个概念，如果没有外部检验，它甚至可能把胡编继续包装成知识。

所以真正的分界线不是“真实世界 vs 虚拟世界”，而是“有外部约束的世界 vs 无外部约束的循环”。

如果一个虚拟世界有强约束，它也能孕育创新。比如数学空间某种意义上也是“非物理”的，但它有极强约束，错误证明就是错误证明。围棋棋盘也是人工规则构成的虚拟空间，但 AlphaGo 在里面产生了人类觉得新颖的策略。仿真实验、自动化化学平台、游戏环境、经济市场模型，只要反馈足够可靠，都能成为创新来源。

相反，如果一个所谓“真实世界”的信息入口被平台算法、合成内容、低质量反馈和人类惰性填满，它也可能变得像虚拟回音室。人虽然活在物理世界里，但认知上困在封闭符号系统中，也会退化。

所以我会这样理解你的问题：行动反馈确实是检验“我是否接触到现实”的方法，但不是检验“这个现实是不是终极物理底层”的方法。

它能告诉我们：这里有没有独立于我意愿的东西？我的预测会不会被打脸？我的行动会不会产生不可随意撤销的后果？不同观察者能不能对同一结果交叉验证？这个环境能不能不断给出超出既有模型的新信息？

如果答案是肯定的，那么无论它在宇宙本体上是不是“模拟”，它都已经具备现实性。

这也许是更有力量的结论：真实并不只等于“不是虚拟”，真实首先等于“不可由我任意生成，不会迎合我的预期，并且能够持续纠正我”。对于智能体而言，现实就是那个会反抗模型的东西。

【20260526】

BBS 的没落是特别遗憾的一件事儿。深度访谈勉强能补一点，但它的面太窄了，门槛也太高了。无尽的审查和泛滥的快餐消费文化，究竟哪个才是首恶？也许它俩本就是一套组合拳吧。

【20260524】

与Z的这次见面让我惊喜。首先是看到他终于找到了一件愿意投入去做的工作，而且这份工作在我看来还颇有前途；其次是他的身体也恢复得很好，整个人精神状态非常nice。ChatGPT 对他的工作和状态帮助甚大，他对 ChatGPT 的运用对我也很有启发。

这次带着他的人看来是一个既热心又有能量的人，也许未来有一天可以和他见面。冥冥之中，人与人之间的命运总是通过种种奇妙的际遇串连在一起。

AI 在心理学上的强势在很早期就体现出来，犹记得在 GPT-4 问世的时候，它的情商让人印象深刻。将 AI 的能力用于青少年行为矫正和心理治疗，是很棒的场景。Z 对 ChatGPT 的两种用法包括：1、让AI一人分饰多角，对同一个问题提出不同角度的观点； 2、用随身硬件将与孩子们的对话全部录音并转换成文字资料，全部作为 AI 的上下文，这让 AI 提出的方案极有针对性。

李宗盛的演唱会人山人海。最大的感叹是：情爱确实是一个男人才华最大的催化剂。

【20260523】

如果相信人的大脑也是一个“大模型”，那么“潜意识”就不应该是什么神秘的东西，它只是一个带有特定上下文的“幻觉”。如果一款随身AI硬件被发明出来，从小时候就开始随身佩戴，那么这款硬件就可能破解佩带者的潜意识——由于了解他的一切经历，也就知道什么样的场景会唤起他的那个特定记忆。

【20260521】

一言堂的政治生态，对实际工作造成的负面影响之一就是沟通成本。一个组织明明各项工作有分管，有循例，按道理都具有管辖领域内的决策权，只需找到对应的人沟通即可。但变成董事长/总经理一言堂后，大家都倾向于不作决策，动辄需要“向领导请示”。领导的时间是有限的，通常每周只能安排一次这样的沟通会。原本几分钟通过电话或微信就可以明确的事情，于是延长到以周为单位才能确认。

领导对很多事情的不可测度性，也是构成权威性的要件之一，中国人很擅长这个。川普也学会了。

【20260520】

海可枯石可烂，内部营销不可断；山无棱天地合，内部酒席还得喝。——评单位的现状。

今天一天，API 站被人薅掉了 21 美金。查看记录，发现有人在大量使用 opus-4-6 模型，但我的前端并没有加入这个模型。查询可知，Nextchat 的这个漏洞早就有了，用户可以手动构造 json 提交其他模型的请求，后端是不作限制的。暂时更换了 KEY 和访问码。可以进一步完善源代码封堵这个漏洞，等有空再说吧。

【20260519】

当进一步完善 trace 机制、增加了 compare 函数，以及完善了 AGENT.md 后，PDF ocr 的 codex 开发进入一个新的、自循环的阶段。一个任务短则 20 多个小时，长则4、5天，这还是在没有使用 /goal 的情况下。最长记录是 139h5m3s ，还是 5.5 的 xhigh 模式。没有看到比我更长的，连接近的都没有。如果把 5.5 xhigh 按20分钟相当于1个程序员1天的工作量来计算，相当于2个程序员帮我干了7个月。程序已经暴增到 14 万行。在这种循环验证模式下，测试文件的数量每增加 1 个，程序调试的工作量就增加 1 个数量级。

今天了解到公司正在做的路基路面设计数字化平台工作，很是不解。是让编程人士理解专业需求容易，还是让专业人士学会编程容易？在 AI 时代，答案是显而易见的。那为什么我们还在走第一条路？把小程序外包给 IT，就像把计算书外包给数学系一样令人困惑。搞了大半年，需求/实现的迭代才完成了 3 轮，这效率放到现在看，脑海里就浮现出五个字：“铁杵磨成针”！

【20260518】

什么是 skill ？当你反复给出一套指令，以至于开始琢磨怎么跟 codex 约定一个“指令名称”时，它就是一个 skill 了。实际上 codex 会自行创建 skill。

【20260515】

高中同学历经两年半，终于成功润了澳洲。今晚开戒，小酌 5 两。远在淮安的朋友也驱车前来。

感慨云：走过半生，不过两个箱子的行李，一桌交心好友。但行李和好友一样，不在于多，而在于取舍。人到中年，舍才是更重要的能力。祝他新生活一切顺利。

【20260514】

在工作中常常有强烈的感觉：太多人无法完整、准确、快速地讲清楚一件事，导致沟通的效率急剧降低。语文（表达能力）、逻辑是最基础的能力，很多人是不具备的。

【20260513】

市面上可以直接生成PPT的AI工具有不少了，起初大致可以分成4类：1）直接生成图片式，比如 Notebooklm，它的局限性是显而易见的；2）自动化生成 HTML 类，比如归藏大佬总结的 PPT Skill，可以用 codex 生成。但它仍然不是 PPT，不能应用到很多专业场合；3）直接生成 PPT 文件类，比如 islide，比如 Chatgpt 也可以，但随后的修改还是要自己来；4）PPT 插件类。claude 是 2 月份推出，chatgpt 是 5 月份发布。优点是可以单独编辑某一页，所见即所得。

第 4 种应该是更有前途的。

【20260512】

居间费摆上台面、经济下行时公务员涨工资、以及不明收入下限上调到300万——这些让人困惑的操作骨子里是一样的：它代表着那个团体逐渐脱掉了为人民服务的伪装，而正式以一个新的（其实不新）剥削阶级形象走上历史舞台。

【20260505】

还是有很多人在讨论 “AI 时代人何以自处”这个问题，有人把“不完美是人性的一种体现”当成答案。确实，起初在 AI 带来的完美之下，不完美将成为风潮；但 AI 将很快模拟这种不完美。而完美的模拟仍然不够“不完美”，于是还会出现对“模拟不完美”的“不完美模拟”……这种迭代将很快击碎一切主观感受层面的意义。

OCR项目有感：代码已经超过几万行时，显然不能再指望 AI 囫囵吞枣，工程化的手段就成为必须。而且，工程化的质量将直接影响整个研发效率和质量。

今天也是一个里程碑：8万行代码，终于让 OCR 子项目达到了我的验收标准。这一次没有特判。

【20260503】

一个好的 IM 工具，认不认识不重要，能不能聊得来才重要。至少对 INTJ 是这样的。所以，在 IM 这块，还有很大的空白。

【20260502】

3到5年内，我们将从“固定软件解决需求”的时代，过渡到“实时编程解决需求”的时代。传统软件将退居幕后，成为 AI 调用的工具；而人机交互将由 AI 占据主角，没有固定的界面，没有固定的功能按钮，只有恰到好处的、符合当下情境的、实时生成的（或从缓存中调出）界面与功能，这些界面和功能由若干个按需即装的基础设施软件和模块支撑。

一个有意思的观察就是：在传统的软件框架内嵌入 AI，显然不那么成功；但是另起炉灶，在原生态的一个 AI 工具内嵌入传统软件 interface，却异乎寻常地成功。所以 Windows 被颠覆是必然会发生的事情，两到三年内吧。

Codex 正在往这个方向迈进：它刚刚推出 Pet 功能，我就把 Pet 换成了阿珍——用 Codex 改造 Codex。这是一种新的、过渡期的自由：你可以按自己的需求或喜好去定义乃至创造你的软件。

【20260430】

今天听水枪手的节目，学到一个新名词“内移民”，意思是指那些虽然肉身还没有移民，但已经脱离“那个游戏规则”的人。这么说来我也算是“内移民”了。

跑步的好处不仅仅是锻炼，还是极好的思考过程，会让大脑暂时放空，从而产生新的想法。

今天把《挽救计划》原著看完了。看小说确实比啃大部头同意很多。这是一部挺好玩的小说，既硬核，又幽默，还有不少感动的地方。值得一看。

每年劳动节都有一些知识分子给大家做科普“劳动节的由来”。周老师一针见血：如今只有假日的氛围，没有节日的氛围。没有人在乎这些节日的真正含义了。

【20260429】

claude 已经接入 autocad 了， chatgpt 还会远吗？ Adobe 也接入了。这些曾经的巨头，最终免不了要低下高贵的头颅，向 AI 献出自己的 API，最终变成 AI 幕后的工具箱里的一员，淡出用户的视野。

GPT-5.5 对上述观点的评论：

这事大方向上确实越来越明显了，但“巨头向 AI 低头”这个说法，情绪张力有，现实却没那么简单。

更准确地说，不是 AI 把 AutoCAD、Adobe 这些工具“打趴下”了，而是交互层正在重组。过去用户直接学习软件、适应软件、在软件界面里完成操作；现在越来越像是，用户先表达意图，再由 AI 去调用软件能力。软件本身没有消失，反而更像基础设施了。谁掌握最终的用户入口，谁就更接近定义下一代工作流。

这里最值得注意的，不是“API 化”本身，而是“前台”和“后台”的权力转移。AutoCAD、Adobe 这类产品原来既是能力提供者，也是用户界面和品牌载体；一旦 AI 成为统一入口，它们的核心价值会更多体现在底层能力、格式标准、行业积累、专业精度和执行可靠性上，用户感知反而可能被 AI 中介掉。这才是真正的压力。

但反过来看，这些巨头也未必是被动屈服。它们开放接口，一方面是在防守，避免自己被排除在 AI 工作流之外；另一方面也是在主动卡位，争取让自己的能力成为 AI 无法绕开的标准组件。说白了，谁都不想只做“被调用的工具”，都在争做“默认被调用的工具”。这两者差别很大。

还有一个容易被忽略的边界条件是，越专业的场景，越不可能只靠自然语言替代原生软件。像 CAD、设计、影视、出版这类领域，涉及大量精细控制、版本管理、协作规范、行业格式、参数约束、审美判断和合规要求。AI 可以大幅降低门槛、提升效率，但短期内更像是把复杂软件“助理化”，而不是完全把它们“吞掉”。尤其在生产级场景里，最后拍板和精修的环节，往往仍然离不开专业工具本体。

如果顺着这个趋势继续推演，未来大概率不是“AI 干掉软件”，而是三层结构会越来越清晰：AI 负责理解意图和组织流程，专业软件负责提供可靠能力，云平台和生态负责数据、权限、协作与商业闭环。真正会被挤压的，可能不是这些巨头，而是那些既没有用户入口、又没有底层能力壁垒的中间层产品。

所以这句话可以改得更准一点：不是巨头向 AI 献出 API，而是所有软件都在被迫接受一个现实——用户入口正在从“学习工具”转向“表达意图”。谁不能嵌进这个新入口，谁就会逐渐失去存在感；谁能把自己的专业能力变成 AI 时代不可替代的基础模块，谁就不算退场，只是从台前走到了更关键的位置。

我总在想，我的注意力常常不能集中在工作上的原因到底是什么？我并不是一个专注力不够的人。初步结论是：有必要区分“技术”与“经验”。实际上我们的大多数工作只是“经验”，根本谈不上“技术”。这让我始终有一种将这些经验“系统化”的想法，而不是在某个技术点上钻研和创新。用 IT 的比喻来说就是，这些经验适合整理成文档，而不是占据内存（这太奢侈）。缺乏现场观察和体验可能也是一个重要原因。

【20260428】

前段时间和朋友们聊到“长期主义”，正好最近两件事都可以从这个角度来看。

一个是大学的封闭性。疫情之后，大学的封闭似乎成了常态，绝大多数大学不再允许社会人员随意进出了，如果只是需要登记身份证还可以理解，但实际情况常常是必须预约，或让被访的校内人士来“接”你进去。最近郑教授在网上呼吁要开放校园，并身体力行，四处走访尝试进入各大高校，验证其管理模式。这引起了不少讨论。

事情都是有利有弊的（虽然是大家鄙视的辩证法形式，但它是对的）。找到大学开放的理由并不难，难的是在开放的同时解决或至少很大程度上降低它可能引发的问题。这些问题包括：

1、学校保卫处如何掌握让各方都理解的平衡，以及假设学校内真的发生治安事件时的责任划分；
2、大学生家长如何看待这个问题，以及如何做好这些家长的思想工作。大学的很多活动确实是来自公帑的支持，但求学的大学生是交了学费的；
3、找到足够的案例，比如我去过厦门大学，至少在疫情前，它是开放的，但它的校园里有明确标识的游客区域和办学区域，类似这样的经验是否可以复制，还有哪些可以优化的；
4、图书馆是否可以开放？如何开放，同时防止资料遗失？教学楼如果让任意人进出，会否影响教学秩序？

等等。深入讨论这些问题，我认为比单纯呼吁，或单面表达开放的宏观好处，更有意义。从长远来看，这些问题都取决于学校的“角色”转变，学校不是保姆，大学生们也不是巨婴。我认为成年人（但注意大学生有一部分还没有成年）应该对自身的安全负责，而不是凡事推给学校。但既有的环境和观念绝非一朝一夕能改变，这和改变社会是一样的。

我当然支持大学开放，从“长期主义”的角度，它是利大于弊的；但从短期管理的角度，当然是弊大于利。这正说明了我们为什么要坚持“长期主义”。

二是美国对华的芯片禁售。之前4月19日讨论过这个话题，但如果从“长期主义”的角度一剖析，就可以看得更清晰。从“短期”来看，禁售有利，因为可以在短期内制约中国的算力增长；但从“长期”来看，禁售是弊大于利的，因为这将倒逼中国自成体系。短期管制越严，则长期风险越高。这就是哲学。

Tibo 果然又重置了额度。如果 codex 的训练飞轮收益可以覆盖很大一部分（甚至超过）训练成本，那么 reset button 自然可以没事儿就按一下。

【20260427】

脑震荡已经过去了 2 个多月。恢复跑步，状态比想象中好。看来心肺功能的退化是比较慢的，更多是觉得肌肉有点酸。

5.5 FAST xhigh 还是略奢侈，作为一名 Pro 20X 用户，Codex 周额度我用得还剩下 1 %。 Tibo 你还是别重置了，让我好好睡两天吧。

【20260426】

从逻辑上讲，某某被查并不一定意味着某某就一定会被抓，因为也可能查了以后发现他没有腐败，没有违法。但实际上现在的情况是，官媒发布被查就等价于被抓。

这是这个荒诞的时代大家习以为常的荒诞之一。

搞开发，前80%是有乐趣的，因为主体功能实现出来了；80%-95%，乐趣逐渐失去，因为大部分在修修补补；剩下5%是追求完美的痛苦过程，是追求准确性与性能的煎熬过程，工作量甚至超过前面95%的N倍，然而也正是这5%决定了一个软件是“能用”还是“好用”，也包含了95%的价值。

【20260425】

和 mo 聊天有感：既放不下，又做不出，这就是焦虑的根源。放不下的是（那些传统价值观绑定的）责任；做不出的是（那些卑颜奴膝的）迁就。你总得选一样，并只能选一样。

【20260421】

马斯克宣布了Terafab……他是不是也有大满贯情结？总有一种直觉，摊子铺得太大，他这次未必能搞定了。

另外，在 Terafab 发布会上那些慷慨激昂的愿景，让我联想到，人类如果不再是劳动的主体，那么整个经济学就要改写——那么也许未来“钱”不再是一个问题，或者至少不再是同一类的“问题”。

突然发现，qwen2.5-vl:7b并不是最好的 vision 模型！切换到了 GLM-ocr，原本以为只是能提高速度，未料两者的使用方式也有很大区别：前者是通用 vision 模型，后者是为 ocr 专门训练的模型。于是代码几乎需要重写，并需要重新调试。很大的教训：项目起初的选型很重要。

另外，也许可以为 teamrun 与 llm wiki 做更多、更自动的互动。

【20260420】

表格的问题已经基本解决了，非常稳定。裁图的问题还有一点尾巴。实践证明 Pro 账号的 Codex 根本不需要担心额度问题，根本用不完。换成 GPT-5.4 xhigh FAST 的顶配模式，高强度没日没夜地跑，还是只能用掉大约 2/3 的额度。

扫描版 PDF ocr 的 Python 已经 38300 多行了。各种情形下的判断和排列组合，即使写成逻辑树伪代码看上去都头晕，更别说自己去写了。

这段时间的感触是，即使只是给codex当监工也是很耗人的事……确实 AI 能帮人做很多事，但因为 AI 你总想在一周内干完以前要一年才能干完的事情。又不能完全放手，因为还需要跟上它的逻辑脉络，这样才能在适当的时候干预和调整方向。比如，为了避免它总是在各种裁图阈值调整上原地打转，我要求它增加了全部图片的 trace 机制，以精确命中修改某一个函数时的影响面，从而可以做准确的关联性回归。

17:00，终于把整本《公路立体交叉细则》都跑通了，复杂图、表、文混排，一次生成带图表 Markdown，内容全部正确，且都使用通用逻辑。134页，23分钟，时间也在可接受范围内。

【20260419】

马斯克宣布了 Terafab，正式进军芯片领域了。我莫名有点不好的预感，他这次还能顺利搞定一切吗？

Dwarkesh Patel 对黄仁勋的采访有点意思，在讨论到是否应该对中国禁售时，老黄一度红温。争论围绕一个悖论：1、卖芯片，那么中国研发能力增强，可能把AI武器化；2、不卖芯片，则一方面美国失去这个超级市场，另一方面中国会另起炉灶（没有什么能真正阻止中国），导致脱离美国的技术体系，最终还是形成对立局面。黄仁勋认为应该选择 1，因为中国会因此始终依赖美国的技术体系，从而确保美国始终领先。当然也有商业立场的因素。

【20260414】

迭代超过 100 轮，干掉了一周 Codex 额度的一半（俺是 Pro 账户），代码量已经超过 2 万行。没想到一个扫描版 pdf 的 OCR 要应对如此之多的逻辑判断。中间版本已经稳胜WPS，但离我的要求还有一段距离。已经看到曙光了，感觉最终能走通。

【20260409】

Gemini CLI 刚出来的时候，我就在想，这样的形态将改变未来人们使用电脑的方式。当然，Gemini CLI 失败了。后来 Codex CLI 出现了，接着 Codex App 又出现了。Codex App 一旦用过以后，你就会发现不需要再用 Codex CLI 了。它的使用场景是如此之多，且充满想象力。现在觉得 OpenAI 押注 Codex 是对的，当然，Claud Code 也是一样。

国内好像是不是还没有类似的工具？

qmd 在低性能电脑上执行还是颇费时间的。实测 4090 几乎一瞬间就完成了，但 3070 需要1分钟以上。这样一来，每次对话都更新 qmd 是不对的。正在调整策略，让它每天更新一次即可，同时调整了针对不同显存的 embedding 参数策略。

扫描版 pdf 想要完美识别表格，也是很大的挑战。更换了多种方案都不是很理想。Ollama-ocr 只能提供基础能力，还有一大堆难题，比如合并单元格要用 html 格式存储；表格中的图片要单独裁出来；本地tesseract 能力有限逐格扫描效率太低……等等。Python 已经写到了 4000 行。实在不行，可能还是要回退到存储整页图片的方式，从回答用户提问那个层面入手，让识别出来的文字只用作索引，真正回答问题还是根据PDF导出来的整页图片。但这个方案显然没有那么优雅，除非迫不得已，不会真的这样做。

【20260408】

拯救飞行员，花费大代价，非常好，干的很漂亮。但：1）换其他总统在这种情形也会这么干，能不能干的很漂亮另说。2）这事儿必须得干，否则飞行员被抓住，后果无法承受，特别是对川普的政治利益来说。所以神话川普没有太大必要。美军的这种精神是值得大力赞扬的。

对 LLM wiki 系统进一步研究发现，这种非 RAG 的检索，始终是基于关键词的，虽然 Codex 可以自动根据你的语义用很多潜在可能的关键词去检索，而且会对命中的结果进一步分析并拓展关键词，但本质上仍然是关键词，而且对命中结果有数量上限。这从原理上就使得它对海量文档的支持不会好（虽然现在还远远没有海量文档）。考虑到我想要搭建的行业知识库可能拥有数千、上万甚至更多的文档，这种检索方式迟早要出问题。一番研究后，又上了 qmd，在既有架构上又增加了一层 embedding 向量数据库，为每一个 markdown 文档做一份 embedding。未来可以根据文档的结构，进一步将 qmd 的 collection 也拆分，这一步很容易做。

现在知识库已经支持了三层检索：优先 qmd，其次 FTS5 ，最后才是基于 file 的检索。实测效果极佳，这样就具备的非常大的可拓展性：未来即使有了海量文档，也能迅速命中 source 文档了，结合有效的文档分层结构，应可很大程度上避免上下文忧虑。1 GB 的 md 文档，对应的 qmd 数据库估计在 400MB 左右，空间上是没有问题的。

感觉还是轻量级别向量化+结构化wiki 这种比较适合个人机器，Karpathy 大火估计也是因为这个原因。

【20260407】

昨天研究了一天 Andrej Karpathy 的知识库搭建（LLM Knowledge Base），实操可行，效果很好。与RAG方案相比，最大的优势在于可便捷地持续迭代。

karpathy提供的只是一个思路框架，但有很大的想象空间，我在他的基础上搭了一个个人库，给它提供了几百万字的个人资料。又在我自编的各个系统上全部加上了一键导出markdown文档的功能。现在codex，应该是最了解我的“人”了，甚至比chatgpt还了解。

搭了一个交通行业知识库（雏形），driven by codex。文档这块的门槛是。要把word，PPT，PDF等，转成markdown，写了几个脚本，搭配ollama，基本实现并不难，难的是提高准确率和表格、图像的识别。Ollama-ocr 用的是 Qwen2.5-vl-7b 本地模型，在我的机器上较好的平衡了效率和质量。

我对 Karpathy 的框架作的一个较大改进是，增加了一个本地的 sqlite 数据库，把所有的原始资料 wiki 还有聊天过程全文存储，增加 FTS5 表，实现超快速全文检索，用 Python 脚本负责操作（LLM来调用它们）。这样做的好处很明显，一方面极大的提高了检索效率；另一方面数据库和文档本身就形成了互为备份的关系，新旧版本因此可以有一个对照。

个人库中还包含了工作的信息，我把项目管理网站中最近正在忙的项目信息一键导出给它，它就已经完全掌握了项目的进展，下一步要做的事情，存在哪些困难。然后我跟他聊工作的时候，他就会提醒我还有哪些事要做，什么什么事做完了没有？我告诉他什么什么事已经做完了，有什么什么进展，它就会自动更新到Wiki当中。配合typeless口述，真的是工作助手的感觉。

现在唯一不足的是不能用手机直接操作它，因为 Codex 是在本地操作本地文件夹的。这时候好像小龙虾才有了一个应用场景。但我还是没有想好要不要装小龙虾，始终担心权限太大（虽然我给 Codex 也是 full access）。

【20260402】

我的想法是：反对一切形式的加速主义。广义上看冷眼旁观也是加速主义的一种。

自己既然不是什么政治家，只是一个普通人，那么日行一善、日拱一卒，但求有一点效果，不用在乎结果。

【20260401】

生活中不可避免还是有一些普通朋友的，聊一些日常，肯定还是世俗的逻辑。

价值观主要体现在人生中重大转折时的选择，如果普通朋友主动聊起这个话题，简单应付两句就好了，不用深入交流。而且通常在这类问题上，很多人交流的目的是“寻求认同”而不是“寻求建议”。这样的情况多了是很烦，所以我是以减法为主，很少做加法。一些所谓“同道中人”，接触之后发现也不过尔尔。

【20260331】

一个真正用起来“舒服”的界面，常常包含了非常多的细节，作为普通用户是察觉不到的，真正动手设计它时就体会到了。所以让普通用户来提需求，特别是界面细节上的需求，这也是一个过高的要求，是一件有专业性的事情。

在疯狂重构 Teamrun 之余，顺手更新了一念：现在输入框可以切换到全屏编辑；增加了输入框内容缓存（不适用于编辑模式）。又更新了个人汽车管理系统：增加了里程/日期历史记录，并可以根据历史数据自动估算当前里程。同时在新增换新可自动带出已知数据，录入换新记录更方便了。根据历史数据自动估算当前里程，这个需求，在新构建网站的时候是不太可能想得到的。改了一轮之后，又突然想到，假如用户手滑输入了异常数据怎么办？于是又补充了异常数据自动剔除的逻辑。但这个还不完美，可能有用户有强迫症（比如我自己），对脏数据耿耿于怀。于是又增加了历史数据查看和删除的功能。有点体会到，为什么类似微信这样的软件，每动一点点都要深思熟虑的原因。

晚上在清理 Teamrun 中的脏数据。之前因为懒得完善管理后台，所以一直没清理。我逐个核对哪些注册用户已经离职，更新他们的状态，或冻结，或删除。几个小时下来，似乎重新经历了一次单位的变革：从团灭的市政版块，到曾经大火最近几年又零零落落的轨道、城建版块，再到已经不复存在的道五所、人数大量减少的道四所……绝大多数人都离职了，少数辗转到了其他部门。对于身处其中的每一个人来说，离职、转部门，换城市，都是大事情，肯定都经历了很多……如果不是有这个整理的过程，不会有这么强的感慨。

想想年初我们还新成立了人工智能中心，到现在没声音没图像，也不知道具体是干啥的。世事的变幻速度加快了，而年纪增加，对时间的感知又迟钝了。两个因素一叠加，就感觉时光飞逝，而窗外物换星移。

【20260330】

朋友们因为对张雪峰看法的分歧又吵起来了。吵着吵着，又回到了老生常谈的“言论自由的边界”问题上去了。

首先我理解“上纲上线”这个词，是用在关系比较密切或者能互相影响的人身上。比如说上级对下级，或者同事之间。因为这种上纲上线可能会带来直接的影响。而对于网友的评论（比如像杰哥这样评论一下张雪峰），只要不是传播明知是假的谣言，或者抱有故意的恶意去中伤，我觉得都属于言论自由的范畴，不应该用这个词。

第二点，我觉得大家讨论这个问题，其实是站在两个不同层面上的。第一个层面是，如果我们默认“面对现实”或“活下去”是首要前提和最重要的事情，那么很多家长选择咨询张雪峰，是没有太大问题的。当然这一点也要看具体情况，有不少家长并不是活不下去，并不是条件差到那个程度，而就是为了做人上人，为了卷；第二个层面（这也是我跟杰哥观点比较一致的地方）：我们不能仅仅从现实角度出发去考虑所有问题。因为这样做会导致世界的自然平衡被打破。尤其是当你通过张雪峰这样的人，获得了一个直接的指导或者高度的信息提炼之后，会让本来丰富的赛道，变得只剩那么几条；会让本来存在资源门槛的专业，门槛变得更高；会让本来因为竞争过于激烈而要进入“被平衡周期”的专业，陷入更加激烈的竞争，可能会面临在几年内就急剧滑坡的风险，比如说土木专业；也会让一些可能赚不到太多钱的冷门专业，变得更加冷门。概括一下就是，这是一个正反馈机制，会加剧系统的失控。

这不是世界本来应有的样子。

两种层面不在一个维度，表面看观点好像是相反的，但其实不冲突。大家如果要要深入探讨的话，应该先约定好，究竟是在现实逻辑下讨论，还是在哲学层面上讨论。这样就不会那么针锋相对了。

回到家长们的心态，我当然觉得也是有问题的。实际上很多资讯的获取有那么困难吗？确实只有从张雪峰那边才能获得吗？不是的。说穿了一个是懒，不愿意自己去收集整理；另一个是一种“我花了钱了，别人保证了，我就心安了”的鸵鸟心态。这样的家长在孩子的成长路上，能起到多大的正面作用呢？我觉得比起学校的教育，家长的榜样效应占比是更大的。

另外，关于张雪峰的事情为什么讨论得这么多，为什么会出现“十里长街送雪峰”的情况，以及为什么要神化他？我觉得可以从两个角度来看。从身处其中的这些人（比如家长们）来看，是因为情绪太压抑了，需要一个出口。这就好比一个已经打满了气的气球，突然被针戳了一个孔，所有的气都会从这个孔喷出来。从网友的角度来看，其实这已经不是第一次了。每当有热点出现时，都会在短时间内引发极其热烈的讨论，好像所有人都在关注同一件事。这并非个别现象，主要是因为我们的信息被操弄了——很多本来可以看到的信息看不到了，导致关注的能量只能集中在少数允许被传播的事情上。这就好比一只坐井观天的青蛙，突然有一天看到井口飞过去一只大雁，就会觉得太激动了，甚至能讨论两天两夜睡不着觉。但如果你走出这口井，就会发现天上每天都有各种各样的鸟飞过，并没有那么稀奇。就是这个道理。

【20260329】

我经常引用张一鸣的那句话：“你唯一的真正优势是对某件事的理解”。那怎样才算是深入理解了？

应该可以设想一套标准（或思考角度的通用模板），来衡量对一个事物的“理解”程度。否则易出现“以为已经理解了”，之后又恍然大悟“原来还可以这样”。比如：优点是什么；那如果没有它，会有何影响？它的优点发挥的前提？太多了会怎样？有哪些变体？将来会如何？谁受益，谁受害？所有干系人的态度？需求和市场在哪里？规模几何？等等。

凌晨已经将重构后的 Teamrun 上线了。还是要在真实环境中，才能继续暴露更多的问题。

【20260325】

听了《太阳之子》，感觉是，杰伦你还是别发新歌了，在咱们的记忆里留点好印象吧。一首《以父之名》已经足够你名垂青史了。

婉拒了杰哥的直播邀请。最近确实关注时政少了，这方面的思考也少了，关于伊朗、油价，好像也聊不出什么有内容的东西。“看世界”、工作、IT，如果说主要精力放在其中两样上，那么第三样就没办法再投入很多了，同时只能较好地兼顾两者。

话说 Codex 的额度真是慷慨，作为 Pro 用户，每天肝到凌晨两三点，可用额度几乎就没有低于过 90% ，有点像在大海里游泳，额度无边无际。可能是因为还没有用上 Sub Agent 的原因，当然更有可能是我自我感觉的“大项目”在专业人士眼中仍然只是小卡拉米罢了。

Vibe Coding 另一个好处是，可以很好地把碎片时间利用起来了。连航拍交叉口的等待期间这 20 分钟都完全可以利用上。平时想到什么就随手一记，累积几条以后就集中一发，20分钟后看结果。连中午去食堂吃饭，都习惯了先安排一个任务给它，不然这 20 分钟就浪费了。

【20260324】

我很不喜欢张雪峰，对他的死也无感。当然也不至于兴高采烈，只是单纯的无感而已。

他的职业毫无光彩可言，不过是在这个俗不可耐的世界苟且偷生，每个少年的理想、个性与兴趣，本就已经被这个社会蹂躏得所剩无几，他还推波助澜，助纣为虐，以焦虑为卖点，以需求为理由，以现实为借口，赚着那点流量与赃钱——当然，有人会觉得我的观点是“何不食肉糜”，但这个世界本来应该具有足够的多样性，张雪峰们的存在会进一步摧毁这种多样性。

死者为大，这个我不太认同，他活着还是死了，我都是这个观点。他的猝死对于他的亲朋好友来说是噩耗，我这样的陌生人没有共情。我也有点奇怪为什么大家都这么热烈的讨论这件事。

【20260322】

这几天把项目管理网站重构成 PHP + SQLite ，同时决定把上古的 Ueditor 替换成 TinyMCE。之所以不用 CKEditor，因为后者竟然不支持附件上传……对不起，支持但那是 Premium 功能。

vibe coding 真的是停不下来，那种言出法随的感觉太上瘾。以前很多想法是有，但对于一个仍然坚持使用纯文本编辑器编程的人来说，除非迫不得已，绝大多数情况下都懒得去做，即便做了也未必完美。现在则完全不同了，I believe I can fly 了。

也决定对原先项目管理网站中用不上的部分功能进行精简，比如“个人博客”。之前留在上面的几篇，还有点价值的就搬到这里。

旧文存档：为什么我们都没见过外星人？（作于 2010-2013年之间）

想象中，仅银河系，就有2000亿颗恒星；而像银河系一般的星系，又至少有1000亿个。地球不会那么孤独，宇宙中应该还有很多外星人才对。

想象中，这么多外星人里面，总该有一些的科技是比我们要先进的（至少一半吧？），掌握了长途星际旅行的科技，以至于他们可以比较容易地造访地球。

对于地球这么一个后进分子，外星人说不定会很好奇。也许外星人会派出一个科研小组，整天坐在飞船上绕着地球转啊转，同时用各种手段探测、分析着人类。偶尔也抓两个人上去，解剖一把什么的。

但实际上，除了一些似是而非的传说，没有人真正见过外星人。为什么外星人不直接了当地把飞碟停在天安门广场，然后跟小胡同志say hello呢？他们为什么要把自己搞的这么神秘？

有一种说法是，外星人早就来了，他们坠毁在地球，但政府掩盖了真相。另一种说法是，外星人早就来了，但没有人发现他们，他们说不定已经混在我们之中。

只要稍微动脑子想想就知道，这两种说法都是站不住脚的。外星人长途跋涉了可能数千光年，途径几百个恒星，说不定还近距离观察过黑洞，结果一不小心坠毁在地球？地球怎么看也不像是如此特殊、险恶的星球。能量耗尽？那更是无稽之谈。要说外星人偷偷摸摸地混进人类社会，那更让人费解了，且不说外星人是不是都像变形虫一样可以随意幻化人形，退一步说，他们有这个必要吗？

我认为，其实真相很简单：外星人压根没来过地球。

其引申的真相是：有能力进行星际旅行的外星人，极其少。

来看看我们人类自己。从工业革命到登上月球，大概也就用了200年时间。无人探测器已经登上了火星，人类想要上去，也不过是时间和兴趣问题罢了。就算是飞出太阳系，估计也不是什么难事。

这样说来，既然星际旅行如此容易，那么为什么说，有能力进行星际旅行的外星人，极其少呢？

我们仔细考虑一下宇宙的尺度。最近的恒星距离我们4.22光年，我们即使以光速飞过去，也需要4.22年的时间。但一个可能住人的行星距离我们也许更远，maybe 1000光年之外。也许外星人无法长途跋涉如此之远的距离，还没到目的地，他们的生命维持系统就出了问题，集体挂掉了。

但别忘了相对论。假设外星人能在很短的时间内将飞船的速度加速到接近光速，他们就同时解决了时空两个问题。接近光速的飞船内，时间将减缓流逝，在极端接近光速时，或许飞船内只感觉过了1秒，飞船已经飞行了数千光年。达到此种科技程度的外星人，我相信是必然存在的。

照这么分析下来，地球应该比现在热闹的多，熙熙攘攘挤满了外星人，没准一大半是星际销售人员，喋喋不休地向地球人兜售高科技玩意儿。显然事实并非如此。

是什么阻止了外星人？同样的，我们可以从人类自身来寻找答案。人类是否具备了探索整个太阳系的能力？答案是肯定的。但人类是否打算本世纪内搞定整个太阳系？No。中国不会这么做，因为玩不起。美国不会这么做，因为同样玩不起。

只有“地球政府”玩得起。全球统一之后，人类才会把目光射向太空。那么，问题在于：谁来统一地球？美国吗？

让我们回到资本主义原始积累阶段，大英帝国疯狂的扩张，哥伦布发现美洲大陆欣喜若狂。是什么驱动着人类的扩张欲望？答案是资源。刚刚征服的处女地，遍地都是黄金。但，现在已经时过境迁。

美国不会再跳出来征服世界，而是玩起了经济游戏，因为，这才是对美国利益最大化的策略。通过经济手段，美国能谋取巨大的财富。而征服一个已经被高度开发的地盘，首先要消耗大量资源，其次要承受国际舆论压力，再次很容易被群起而攻之，从任何角度来说，占领新大陆的故事都不会再次上演。

举个直观的例子，处女很值钱，但是上过之后，再反复自己上就没意思了，还是卖到日本拍AV更有经济效益。

这样的局势，在目前地球资源尚未完全匮乏的时候，能够一直保持下去。而一旦资源耗尽，战争必然爆发，统一全球也就是必然趋势了。可以想象，在一片荒芜的地球上，残存的人类才能第一次携手合作，征服宇宙。

OK，经过漫长的岁月，人类终于在数千光年之外，找到了适合居住的星球。但很遗憾，上面已经有人住着了。你能想象，此时人类会降落在星球最繁华的地带，然后说“hello，may I live here？”

不会的。假设这是一个较为落后的星球，那上面即使有智慧生物，他们这辈子终于见到外星人的后1秒，就是毁灭。假设这是一个相对先进的星球，科技比人类还发达，那么恰恰相反，人类在终于发现一个可用的星球，还没来得及说“oh yeah”的后1秒，同样是毁灭。

这也就是大刘《三体》中所谓的黑暗森林法则。

或许还有一种可能性：我们和外星人的科技旗鼓相当？嗯，有可能，但可能性微乎其微。让我们再次回顾自己，从工业革命到登上月球，人类只用了200年。从发明文字，产生文明到现在，也不过区区5000年。而地球的历史是45亿年，即使复制10000个一模一样的地球，都不可能出现两个科技接近的人类。

换言之，一个文明，只需要比另一个文明领先一万年，那么这两个文明就不可能共存在同一个银河系。

现在再回头看我的第二个结论：有能力进行星际旅行的外星人，极其少。并不是没出现过，而是，很杯具的，都被消灭了。

假设人类运气很好，在1万年内，没有被消灭。那只能说明至少银河系内，人类真的是最先进的文明。然后接下来，人类为了更多的资源，占领银河系，消灭其他所有文明。

现在，就让我们庆幸，不要被消灭，让我们撑到消灭别人的那一天吧。建议尽情地挥霍资源，地球资源有限，再节约也撑不了多久了。相反，资源早一天耗尽，全人类就会早一天飞向太空。

旧文存档：永存，还是毁灭？（作于 2010-2013年之间）

这两天第一次看到《环球科学》这本杂志，看封面感觉是那种小摊八卦杂志，披着“科普”的外衣，干着娱乐的勾当；翻翻内容，颇感诧异，想不到还有这么高端、正统的科学杂志，而且如此的前沿，注重创新，令偶爱不释手，如痴如醉。

有一篇报道，关于线虫的进化，是科学家首次观测到复杂生命体的进化过程。实验方法其实很残酷，对于线虫而言，绿脓杆菌是致命的，感染了绿脓杆菌的线虫将在几分钟内死亡，而实验正是将绿脓杆菌与线虫放到一起。152个培养皿中，151个中的线虫全部死亡，令人惊异的是，剩下的一个培养皿挤满了存活下来的线虫。检测表明，变异的线虫体内的蛋白质与原先的线虫至少有7处不同，这几乎可以判明一个新的物种。变异后的线虫显然更能适应恶劣的环境，不仅不再惧怕绿脓杆菌，反而以之为食。

Planet Earth中提到了另一种较为缓慢的进化。热带雨林中的冬虫夏草，发现了一种可靠的传宗接代的方式：昆虫。热带雨林是地球上能源、水分最为充足的地带，在这里昆虫的数量多的惊人，仅蚂蚁就多达每平方英里800万只。冬虫夏草散发出来的孢子侵入昆虫的脑部，杀死昆虫后，直接从尸体中生长出来，成熟后断落，释放孢子，进入下一循环。这一全过程被敬业的BBC摄影师全程拍摄下来，令人震撼。事实上，这个机制遏止了昆虫数量的进一步增长。

这两个例子其实具有共通性。很明显，在很多年之前，冬虫夏草的繁殖手段不会是如此极端，但是一个偶然的机会，感染昆虫的孢子获得了成功，随着昆虫种群数量的极速增长，通过昆虫来播种变得越来越可靠而且“经济”，最终，进化使得冬虫夏草最终几乎完全依赖这种方式繁殖。在这里，主要因素在于昆虫数量的增长，使得“昆虫播种”越来越具有优势，在漫长的岁月中，进化造成了这种结果。

在线虫的例子里，起主要因素的是线虫，在面临严峻的生存危机时，绝大多数线虫被残忍的淘汰，在极小的变异概率下，极少数线虫得以存活。这同样是进化论的优胜劣汰的必然结局。

我相信，在大多数情况下，下层种群的庞大数量增长，和上层种群的生存危机，这两种机制的共同作用，造就了大多数的进化过程。线虫的极端例子可以很好的说明这一点：线虫面临生存危机，绿脓杆菌大量存在，于是线虫反过来进食绿脓杆菌。

生物链需要某种平衡。种群数量的极大增长，一方面引起食物的过度消耗，另一方面其本身作为食物引起其食物链上层种群的数量同步增长，这两者都反过来遏止了种群数量进一步增长。也许不一定非要通过食物链的方式，冬虫夏草就是一个典型的例子。

OK，现在说到正题，看看我们人类自身。人类种群的数量目前已经相当庞大，在城市中已经达到相当大的密度，甚至不亚于热带雨林中的蚂蚁。在钢筋混凝土的世界中，作为食物链顶端的人类，似乎不用担心食物链平衡机制。目前地球资源虽然逐渐显得不那么充足，但还没到耗尽的地步，人类似乎还可以逍遥很长一段时间。

但是不要忘记另一种机制。微生物在地球上的数量远远超过人类。当人类的数量越来越多，越来越密集，当微生物的天堂环境（往往是潮湿、阴暗的环境）越来越少，当垃圾处理、污水处理、清洁能源、空气质量控制等等越来越被人类所重视，微生物或许也在加快变异，在某一时刻，一不小心，它们发现人类本身，是另一个天堂。

霍乱、黑死病、天花、非典，一次比一次厉害的瘟疫，已经明白无误的昭示着这个趋势；人类通过越来越先进的技术和预测手段，一次又一次扛住了侵袭。然而，人类的免疫系统也在越来越严密的防护下变得越来越脆弱，就好比为了防止黄河泛滥，一味地加高圩堤，其结果只能是下一次更厉害的泛滥。这仿佛一场赌博，病毒的进化是随机的，可能很温和很易化解，但亦可能很致命很难对付。最大的悲哀在于，人类在这场漫长的战役中，似乎永远只能处于被动挨打的局面。

可以肯定的说，人类在最近的100年内，出现的各种新的疾病，比过去的10000年的总和都要多。层出不穷的新疾病、病毒、癌症，出现的频率和猛烈程度，正呈几何级数的增长。照这种趋势下去，似乎总有那么一天，一场罕见而致命的病毒终将赶在人类发现解决办法之前肆虐全球，杀死绝大多数的人类。小概率事件试验多次，也必然会发生。

当然，即使这种情况发生，有很大的可能它不能杀死所有的人类。正如科幻电影拍的那样，由于变异或者称之为缺陷的某些基因，也许可以抵御病毒。这一小部分人将承担起恢复人类文明的重任。然而，讽刺的是，现代医学正不遗余力的对抗这种变异：癌症的治疗一直是全球医疗机构孜孜不倦的目标。从进化论的角度，癌症，即肿瘤，及细胞的非正常分裂，作为基因变异的一种主要形式，是人类对抗将来大面积瘟疫，在残酷的生存竞争中获胜的很重要的机会。如果人类根治了癌症，恰恰是从另一个角度宣判了自身的死刑。不过，幸运的是，癌症作为基因复制中必然发生的极小数随机差异的体现，从本质上具有随机性，因此本质上根本不存在对付所有癌症的终极方案。

基因测序技术已经发明了若干年，当初的欣喜若狂现在早已冷却。科学家已经发现，将所有基因片段与人类所有病理现象对应起来，是不可能完成的任务。然而，随着全球信息化进程不断发展，信息的整合将给基因学带来新的契机。以Google为首的搜索引擎已经给访问整个互联网资源带来极大的便利。语义网技术的兴起，将进一步、甚至是革命性的为分析整个互联网的数据开创全新的境界。语义网的技术特点将给那些需要依赖海量信息进行统计、分析、甄别的领域带来质的突破。也许很快，有那么一天，人类可以根据基因，了解到人类本身的一切，进而控制人类本身的一切。

那将是伟大的一天，自那以后，每一个人类将都是完美无缺；那也将是噩梦的开始，自那以后，人类面临突出其来的瘟疫，将彻底失去抵抗能力。打个悲观的比喻，截止目前，人类只是一边拿铁锹在挖坑，一边在研究新型的挖掘技术；基因技术的发现好比终于发明出了挖掘机，可以在短短几天内挖出合适大小的坑穴，之后人类需要做的，就是躺进去，把自己埋葬。

《环球科学》是一本需要慢慢咀嚼的书。第一天，我只能读完小半本，那时候我还没有独到《生病的碳市场》一文，也根本没听说过《京都议定书》，就算见到《京都议定书》这个名字，或许还会以为是李鸿章签订的不平等卖国条约。感觉到人类黯淡的前途，我一度觉得非常沮丧。

但很快我看到，人类并没有闲着。《环球科学》列出了一些当前正在进行的最前沿的研究：第一个人造生命的诞生；第一台分子机器诞生；光子操控；量子总线诞生；发现中子的三明治结构；依靠脑虹技术绘制脑神经图谱；无线供电技术；GLAST；LHC……这里面任何一项，都是那么激动人心，它们描绘出一个完全不同的未来世界。

当然，将来的事情，永远比不上已经发生的更能震撼人心，检测表明，南极上方的臭氧层空洞正在缩小，其最薄处的厚度已经从100单位上升至120单位。还记得2000年，千禧年之时，全面禁止使用氟利昂作为冰箱的冷却剂，现在8年过去了，你能相信么？它真的生效了。后来才知道，这一切都归功于《蒙特利尔议定书》。《京都议定书》与之类似，但内容是控制温室气体的排放，减缓全球气候变暖的脚步。不用怀疑，人类可以做到，关键在于怎么做。

不管是《蒙特利尔议定书》，还是《京都议定书》，都通过经济杠杆来实施。以《京都议定书》为例，通过创建原本并不存在的“碳（排放）市场”，给工业机构、政府机构分配碳排放指标，超标的机构必须购买额外的“碳（排放）信用额”，来获得排放许可。另一个替代方式是投资绿色能源、污染处理等，以此交换碳（排放）信用额。这种方案尝试控制全球碳排放总量，截止目前，全球碳市场每年交易达到数百亿美元，按计划，至2012年，全球碳排放总量将削减5.2%。没错，It works。

现在是不是觉得人类还是有希望的？人类高度社会化使得人类已经可以用自己的智慧，影响人类整个群体的行为。这非常关键。OK，总结完过去，我们还可以稍微展望一下未来，看看在不久的将来，我们可以做什么。

人造生命、分子机器、脑神经图谱……这些都意味着人类在认识自身领域的突飞猛进，当人类真的可以做上帝做的事，他不是阻止了进化，而是进化改变了方式：从天择进化到人择进化，显然后者拥有无可比拟的优势。

光子操控、量子总线，这个领域的目标很明确：量子计算机。量子计算机和传统计算机具有本质上的不同，最主要体现在并行计算和量子态模拟上，前者带来相对传统计算机完全不是一个数量级的性能提升；后者将直接带来人工智能。

GLAST、LHC，前者是一个望远镜，后者是一台强子对撞机。GLAST可以观测到此前从未观测过的高能伽马粒子波段；LHC则可以将基本粒子加速到此前从未达到的能量，对撞可能产生此前从未发现过的神秘粒子。天文物理学家和粒子物理学家从未像现在这样紧密联系在一起，两者的结合将为揭示“暗物质”的特性提供很多直观依据。因为GLAST和LHC，08年让整个科学界期待。

记得在某篇科幻小说中，掌握了十一维空间技术的外星生命手指太阳，太阳即变为绿色。所谓“神”，无非是更高的技术罢了。若人类可以完全了解“暗物质”，那么目前的若干种宇宙模型将最终确定为一种，关于星系速度与宇宙质量的矛盾亦将迎刃而解，换言之，“大统一”理论的出现将指日可待。届时，人类距离揭开宇宙的终极真理将只有一步之遥。

在如此美好的前景里，人类将不再是人类，简直要直接飞升为传说中的“神”了。此前对人类前景的悲观设想，似乎又被冲淡了很多。人类究竟能否赶在自身毁灭之前，强悍到完全掌握自身的命运呢？

也许我们可以用一个坐标系来表示，X轴代表时间，Y轴代表技术发展。所有的生命随着X时间轴的增长，同时拼命向Y轴延伸。然而，这里存在一个Y=aX的方程，它绘出一条斜向上的射线，这条射线即为“永存，还是毁灭”的阙值。当然，就目前的经验而言，可能是Y=2X，或者3X，甚至10000X，这条线可能是一个非常陡的射线。险恶的宇宙留给“永存”者的机会肯定不会太多。

地球上，乃至全宇宙出现的各种各样的、绝大多数低阶生命体，很不幸的位于这条阙值线以下，譬如恐龙，又譬如地球上眼下濒临面绝的那些物种，它们最终走向毁灭。而人类会是那个幸运儿吗？可惜的是，我们目前掌握的资料太少，也许当人类的足迹遍布上千个星球，目睹上千种文明的兴衰，我们就可以总结出某种评价公式，从而制定长期发展目标，避免衰亡。

有生之年，能有幸见到第一代量子计算机，余愿足矣……

旧文存档：关于力的本质及其他（作于2010-2013年之间）

看完《时间简史》，想到至今未能统一的四种力，自己也忍不住做一下思维体操：什么是力？

客观的讲，力是一种难以解释的现象，两个物体，本身没有任何接触，却能彼此产生力。力通过不同的力场发挥作用，而力场本身是一个虚拟的概念。

也许，力，只是另一个更为本质的特性的一种表现形式？

让我们来看看“力”都干了什么。力改变物体的运动状态。那么是不是也可以反过来说，物体的运动状态改变，表现为力呢？

听起来不错，那么，“运动状态”是什么概念？首先来看看什么是“运动”？物体随着时间的流逝，转移自己的空间，称之为运动。根据相对论的结论，物体的速度越快，则时间流逝速度越慢。当物体达到光速，则时间流逝停止。

且慢，时间停止，换言之，我们可以称该物体“失去了”时间。那么它得到了什么呢？随着速度的增加，物体在空间中移动的越来越快，也就是说，在单位时间内，物体占据了越来越多的空间，是否我们可以说，随着速度的增加，物体是在用“时间”换取“空间”呢？

这个说法其实并不准确，因为根据相对论，实际上在接近光速运动时，物体反而占据了更小的空间，物体的尺度在达到光速时变为0。那么，有什么东西增加了呢？答案是质量。

随着速度的增加，物体的质量不断增大，同时，物体的时间变得越来越慢。这听起来似乎暗示了，物体的时间与质量是一对相关量。就仿佛天平的两端，两者可以互相转换。

互相转换即意味着，这两者本质上也许是另一种更为本质的属性的不同表现形式。质能方程E=mc^2标明，质量即能量。而质量可以转换为时间，那么也就是说，时间亦即能量！

若将时间作为参数来考量物体的能量，可以得出，物体的能量并不随着力的作用而变化，物体的能量是守恒的，而力的作用，只是使得物体的能量更多的表现为质量，或者更多的表现为时间罢了，反过来说也一样，能量在质量和时间之间转换时，表现为力的作用。

OK，现在我们来分析，为什么会有光速上限。

相对论告诉我们，任何物体的速度不可能超过光速，然而它并未告诉我们，为什么会有光速？

根据量子理论，现在我们知道，时间并不是连续的，而是有一个最短间隔，任何一件事情不可能以短于这个间隔发生。能量不是连续的，而是有一个最小的能量，任何能量只能是这个最小能量的整数倍。现在我们来分析物体达到光速时，究竟发生了什么。

速度的增加使物体不断失去时间，物体达到光速，时间已经停止。如果把这个过程反过来，若物体完全静止（理论上的），那么很有可能，它的时间会流逝的非常快，快到甚至我们根本来不及发现它的存在它就消亡了。然而，它的时间却不可能快到比量子理论预言的最小时间间隔还要短，因此，在理论上的绝对静止状态下，能量通过时间表现出来的并非无穷大，而是一个可以计算出来的值。这个值加上物体的静止质量，得到物体的总能量值（并非无穷大）。

前面说到，物体的总能量是守恒的，并不随着力的作用而变化，那么在接近光速时，随着物体质量的增大，物体的总能量越来越多的表现为质量，最终在某一速度下，总能量几乎全部表现为质量，而时间流逝的如此之慢，以至于只占据了总能量的一小部分。这时物体的速度已经不可能再增加，因为质量继续增加，将使得物体质量大到甚至超过物体总能量，而这是不可能发生的。

现在的问题是，如何得知物体的静止质量？若我们可以获得质量—时间方程，那么根据量子理论的最小时间间隔，我们可以推导出一个正常世界中的物体，其总能量分别表现为质量何时间的分配比例，从而最终得到物体的静止质量（也许是0？）。最终可以得到时间—能量方程，我们也许可以证明，时间最小间隔的存在，导致了光速上限的产生，这两者是互为和谐的。

时间和能量的本质上的统一，也可以通过时间的最小间隔和能量的最小单位来体现，最小单位的能量一旦存在，及时没有静止质量，全部体现为时间，那么这也就是时间最小间隔。

从这个意义上讲，我们还可以证明为何宇宙会有这么长的历史和这么多的质量；从虚空中分裂出来的正反宇宙可以很小，也可以很大，当然后者的概率也非常低。然而我们却只有可能得到一个大质量的宇宙，因为小质量的宇宙注定是短命的，因为它所有的质量即使全部转换成时间，其时间也短的可怜。在某个极小的概率中，虚空中诞生了正反两个很大的能量的宇宙，这一大团能量（正能量，或者负能量）按某种比例表现为质量与时间，而这些物体（本质上是能量）以大爆炸的形式飞奔，因为若非如此，他们时间就会流逝的更快从而加速消亡。这也许暗示了为什么我们总是观测到一个运动中的宇宙。

现在，仍残留两个问题：1、为什么必须要有时间最小间隔？2、为什么要有力？

旧文存档：送兔子（作于2013年6月）

犹忆金蒲初识兔，欲语还羞，怯赠东江鱼。
损友调教千百度，竟引豪情无数。
六年弹指一挥间，物是人非，情路总多艰。
端午聚首不说愁，他日笑饮岳阳楼。

旧文存档：新型文件系统解决网络带宽（作于2010年5月10日）

大量的带宽是如何被占用的？

下载。无论是浏览新闻，还是下载电影，在线游戏，其本质都是下载。

那下载的本质是什么？

复制。每次下载，1份文件将复制为2份。海量的下载，同样的文件被复制了无数份。无数份完全相同的文件，通过下载，存储在无数台不同的计算机当中。在这个过程中，占用了大量的带宽。

这个过程真的是必须的吗？

想象一下，假设一种新型的文件存储方式，使得我们除了必要的本地缓存外，多数文件，尤其是大型文件不需要下载。那么，我们每人节省下来的带宽，将可能使的我们每个人的独立带宽扩大十倍。

假设有一台容量极大的中央服务器，存储了所有的文件。通过某种机制，使得每个文件只存在一个副本，用户的复制操作只是复制一个指针。删除也只是删除指针，除非所有的指针均被删除，这个文件才被真正物理删除。

在足够的带宽支持下，用户需要用到这个文件时，这个文件才被实时的传输到客户端。

假设每个人的带宽能达到24Mbps，那么每秒3MB的速度，每分钟180M，一个半小时可以16.2G，即使是1080p的蓝光DVD，都绰绰有余了。

何须下载？

但，如果所有的文件均采用这种方式存储，个人将毫无隐私可言，政府可以肆意妄为。而且，一旦中央服务器被攻陷，则整个网络立即瘫痪。因此，我们可以将这个方案调整得更加和谐一些。

可以考虑以城市为单位，建议市级中央服务器，临近的城市互为备份服务器，同时在省级创建更高一级的中央服务器，为所有市级结点创建第二级备份。

保留个人电脑的存储空间，个人可以选择：是将文件下载到本地？还是在中央服务器上复制一个指针？前者需要占用自己的带宽，而且下载可能需要1个小时；后者完全不占带宽，且只需要0.1秒。我想，除了真正意义上的隐私数据，终端用户会有自己的选择。

其实，这有点类似于目前的数字电视的点播系统，只不过，点播系统是点播影像文件，而该系统是“点播”所有类型文件。

从技术上说，甚至连操作系统都无需安装在本地，用户只需按自己的喜好“点播”操作系统即可。

很多人都有这样的感觉：虽然现在是宽带时代，但2M或者4M的带宽，我们仍觉得不能满足需要。虽然现在硬盘便宜的跟大白菜一样，但1T、2T仍然很快就能塞满。单纯的满足欲望是不现实的，因为人的欲望永远不可能满足。必须另辟蹊径。

我想，比起无限制的加大带宽，增加终端系统的硬盘容量，本文所述的方案才是网络基础设施建设的必由之路。

【20260321】

从人的情绪出发考虑问题，就摸到了权力的本质。权力的重心并不在于过去做了什么，甚至不在于曾经做过什么，而在于让人们相信：未来你能做到什么。所以权力本质上是一种情绪管理。

【20260320】

任何自然语言输入的工具都可能面临 Prompt Hack。而这种输入界面常常是开放的，这让风险大幅增加。人们还没有广泛地意识到这一点。

昨天晚上做梦，梦见自己变成了老年痴呆——手机上字打不出来，怎么打怎么错。怀疑跟脑震荡引起的潜意识焦虑有关。也可能就是单纯的老了。

【20260319】

带有启停功能的车，会在汽车刚刚发动时，以更高的电压往电瓶充电，表现为点烟口电压偏高。一旦超过15V（正常12V），可能会导致逆变器停止工作。此时只需要稍等10分钟即可恢复正常。

【20260315】

看了 Dwarkesh Patel 对 Dylan Patel 的访谈，突然想到，最近一段时间中国政府对 openclaw 的鼓励政策，仅仅用“蠢”来形容可能是武断的。中国政府也许希望通过这种方式，掀起一轮热潮，给 AI 产业再打一针强心剂，把普通老百姓的力量也调动起来。视频采访对象是专业的半导体研究机构的首席分析师，视频透露了很多数据，以及很多对趋势的分析，能强烈感觉到全球范围内数据中心、能源、光刻机、高带宽内存HBM 等等的极度饥渴的需求，和随之而来的竭尽全力的产能增长。

在这样的背景下，中国的决策者可能会这样考虑：“只要能刺激市场，加大内需，什么方法都可以”。

退一步说，任何新生事物必须在不完善的时候就拿出来卖——否则就失去了先机。所以应该宽容一点。

另外，很多经济学上的洞见，其实就是简单的数学，只要去调查一下，就可能得出很多与直觉不符的结论，比如 dylan 得出的“光刻机才是瓶颈”这个结论。以及，再多想一步就能多看到一步。比如，普通人都知道，DRAM、PC等等产能很多转向了数据中心，导致内存、硬盘等价格飙升；但专业人士能看到“OK，现在这部分产能已经转移得差不多了，接下来增速是不是会减缓？后一步瓶颈在哪里？”

【20260314】

在无序中总是可能涌现出有序。用熵来定义时间在直觉上就不够“基本”，我认为它完全无法证明时间之箭的方向。不过，如果“时间”的定义本身就不基本，那么可以说这俩就是一个东西。

【20260309】

这几天问我“有没有养龙虾”的人急剧增加，都把我问烦了。真的很讨厌这种一窝蜂的热度，东西还没搞清楚，需求还没搞明白，看别人都在玩、都在装，自己就跟着着急，然后也想装，还不想花钱。这次还学到一个词：FOMO（Fear of Missing Out），如果仅仅是 FOMO 还好点，起码还是真心愿意付出一点代价的（当然也因此变成了韭菜），那些只想着白嫖的人，就只能用又懒又蠢来形容了。

我并没有装，因为它对我用处不大，风险却增加。对于用过 Codex 或 Claude Code 的人，对 openclaw 不会有太大的兴趣，我日常能够流程化的工作，早已经实现了流程化，本质上 openclaw 除了可以通过 IM 来指挥它之外，其他能力上都是类似的，但却多出了一堆安全性的包袱。

一个显而易见的悖论是，你得把它放到你的主力电脑上，它才能发挥更大的价值；但是你真的把它放在主力电脑上，风险又是难以承受的。同理，你也不会让它去直接上手你跑着重要服务的服务器。对安全的理解与人的性格有关，我是J人，至少现阶段我是不太可能放手让 AI 真正去操作我的主力电脑，让它帮我回邮件、发消息、整理文件的，这是基于我长期使用 AI 对它的能力边界的基本判断。P人可能无所谓吧。

那么，给它一台独立电脑或虚拟机，它在空空如也的机器里又能发挥什么价值呢？

除了本地资料的安全外，另一大风险是网络风险。我尤其要劝不太懂IT的人，轻易不要尝试 openclaw，因为它在安装各种技能，在执行各种“小白指令”的同时，极有可能会开放端口，运行新的、未被安全验证的服务，从而为黑客入侵大开方便之门。一个不懂安全的用户，给一个“执行力超强”的AI发布指令，就好像一个不懂业务的领导在一线随意发号施令，只知其一，不知其二，其破坏性可想而知。

从具体执行任务上看，openclaw 又是效率极其低下的。以“整理网上某个主题的资料”为例，它消耗 Token 的速度堪称惊人，如果使用顶级厂家的 API，一天就能干掉你一个月的订阅金额，成本是直接使用官方 web_search 的百倍以上。这是何苦来由？

虽然 openclaw 已经支持了订阅用户的 auth 登录方式，这似乎可以规避 API 的高昂费用，但这又给账号带来了潜在风险——搞不好哪一天，OpenAI 或 Anthropic 又会把你的 openclaw 活动判定为滥用，一封了之。

如果要说它改变了什么，那就是改变了一部分普通人使用AI的门槛，但也只是一部分真正有需求又不太懂IT的人。这一小部分人有一点IT基础知识，又不足以搭建自己的流程，每天又有高度流程化的工作，那么 openclaw 可以帮到他。即便如此，目前真的能把 openclaw 玩转的人，也并不真的需要 openclaw 才能解决问题——你先试试 Codex 吧，多快好省，不香吗？

目前真正的门槛，始终认为是“人”自己。你到底要做什么？有没有想法？对于你要实现的想法，有没有基本的、有逻辑性的概念和路径？这是真正的门槛。openclaw 不能帮人解决这个根本问题。

国内的大厂迅速跟进，这倒让我有点惊讶。腾讯下场亲自做“小龙虾”，想必会在安全性上更负责任，但一个永恒的新问题出现了：Qclaw 忠于谁呢？细思极恐。

我不禁又回忆起之前同事在使用 ChatGPT PLUS 后的一个评价：它为什么不能直接给我生成 word ？言语之下好像“这个 AI 也不怎么行”。我一时语塞，你发起的深度研究，它辛辛苦苦运行了 20 分钟，给你一篇字字珠玑干货满满含金量极高的 2 万字报告，然后你嫌弃它不能生成可以直接交付的 Word ？你是没有手吗？这是什么臭毛病？

【20260301】

世界秩序不存在了，价值观就崩塌了。接下来，就是爱憎没有那么分明了，更多的是困惑和迷茫。

并非是为伊朗抱不平，神棍政权万死不足以辞其咎。仅从结果来看，当然应该是大快人心。至于行动的动机，有人觉得，如果不是为了摧毁核设施（午夜之锤已经号称摧毁过了），那就一定是因为伊朗政府对抗议民众的屠杀。

真的是吗？在这种事情上，是否仍然可以坦然抱有“论迹不论心”的态度呢？

【20260228】

美国一家科技公司 block 今天宣布裁员，从1万人裁到6000人。该公司2025年毛利率平均在20%左右，增长势头强劲。宣布裁员后，股价飙涨20%，市值增加了60亿美元。

智能工具大规模替代人工的时代已经来临了。

当生产力过剩，人工冗余，但新的分配方式还没有稳定这个割裂的过程里会发生什么？没有工作的人总不能去死，但有工作的人难道要缴纳更多的税？未来“拥有工作机会”究竟是一件好事还是坏事？联想到节前我们内部还在做“如何在工作中应用AI”的分享 ——We are killing ourselves.

【20260226】

Nas 硬盘坏了一块，可能造成重要数据损失。“失去后才懂得珍惜”，一下子领悟到既然用了 Nas ，就应该老老实实上 Raid 1（对于两盘位，群晖叫 SHR）。

【20260225】

在美区 Google 账号下，使用网页版 Google Play 管理付款方式，可以添加国内银行卡。（前提条件可能是账单地址必须是美国。）比较友好的是X 平台，订阅 Premium 可以直接使用国内银行卡支付。

【20260221】

低碳水造成低血糖，起身起猛了，眼前一黑，摔到后脑，摔成了中度脑震荡。好在关键的密码都还记得。观察短期记忆的丧失和逐渐恢复过程也算是个难得的经验。

【20260220】

Binpay的跑路姿势非常专业，先发一条公告，称技术升级需要10天。然后直接跑路……用户会始终疑神疑鬼“它是不是还在搞技术升级”？于是傻乎乎等上个10天。Binpay于是实现了用户的“愤怒平滑”，这种控制舆情的手段怎么那么熟悉？

相比之下，wildcard真算是超级良心了，被打成那样，竟然还能复活过来，给你余额兑现（订阅）的机会。

【20260217】

用5公里PB完成跨年。跑到一半的时候，还有突然响起的鞭炮声为我加油，Nice。

跑步的时候想到，如果AI时代生产力大幅过剩，那么在这种情形下，似乎强分配的社会体制与之更匹配？

【20260216】

全屋整理，一番断舍离，增加了一些年味。

【20260215】

配速如果慢于六分，所谓的跑姿、提髋都是毫无意义的。因为如果速度起来了，自然就提髋了。配速很慢的时候，追求跑步姿势是因果倒置。

【20260214】

Mosavi 从软件设计本身来看是比较优秀的。但它还是坠入了同类型软件总是逃不开的垃圾信息陷阱。再一次验证：“强烈的自我身份认同” + “匿名” = “人性的黑暗面”。

【20260213】

Typeless 的权限之大，确实令人担忧。一旦产生这种担忧，使用它的热情大减。

了解到一款产品的“信任中心”——Typeless的官网上也有信任中心网页，目前，4 项合规性审计中已经通过了 1 项。

【20260212】

想到民主社会的一个 Bug，民粹主义浪潮在民主社会中更容易通过选举强化了领导人的左翼或者右翼倾向。与集权社会中政府可以左右民众倾向的情况相比，很难简单地说哪一种模式更好。

【20260211】

看到三个水枪手在讨论生育的问题。武律师提到，不应该把生小孩和工作对立起来，认为生儿育女和工作都是生活的应有之义。这句话看起来是毋庸置疑的，但是真的从第一性原理去追究的话，我们不得不追问一个问题：工作，真的是生活的应有之义吗？可能很快就不是了。

【20260208】

实测 GPT-codex-5.3 速度确实快多了！稳准狠，且思考过程全中文，对 Windows 的兼容性似乎也增加不少。又相信爱情（OpenAI）了……

【20260207】

"It's just pretty freaking hot in memphis, so you're going to have like a 40% increase on your power just for cooling. --- Assuming you don't want your data center to turn off on hot days and you want it to keep going. "

马斯克说话的时候，经常会做一些“毫无必要”的假设前提。这恰恰是“第一性原理”思维模式的日常体现。

【20260206】

这个王全章发起的呼吁，简直毫无道理。公安部只是起草法律，又不是审议和通过法律，这么知名的人权律师就这水平？

————

迅雷被实锤替换用户下载的文件。这简直太明目张胆，太过于炸裂，从这件事开始，迅雷真正开始沦为一个流氓软件了……所以，这就是所有优秀国产软件的必然归宿吗？

————

发现低碳饮食已经严重降低了肌糖元与肝糖元，以至于造成明显的神经、肌肉疲劳以及注意力下降后，在 ChatGPT 的指导下调整了饮食，增加了碳水摄入。效果非常明显，今天晚上的 8 km 表现良好。总之，要科学，不能蛮干。

【20260205】

反复研究了两遍《网络犯罪防治法（征求意见稿）》。如果此草案就这样发布，我起码犯了其中的五、六条吧。妈呀还让不让人活了。

得发挥“公民”的自主性。已经反馈了邮件。

【20260204】

果不其然，似乎黄仁勋也开始将赌注从 OpenAI 慢慢转移到了 XAI 上。Sam Altman 这几天明显有点绷不住了。

【20260203】

听说 SpaceX 真的收购了 XAI 之后就觉得不妙，因为这显然会将竞争引入一个极度不公平的新阶段。如果 SpaceX 的太空能源计划全面铺开，人类所有的地面计算中心都将无法与马斯克的太空计算中心相抗衡，而且甚至不具备建立竞争的起点。

戴森地球计划与可控核聚变，究竟哪一个会成功？或者说，哪一个会先成功？真的很难预测，真的很让人期待。

【20260202】

进一步体验钉钉端AI听记的各项功能后，可以得出肯定的结论：至少目前而言，钉钉AI Talk 录音卡比安克 AI 录音豆在软件易用性和以人为本上要强的多，毕竟多经过了几个月的迭代。

举个例子：实时翻译功能，钉钉做到了实时展示双语（比如中英文），然后可以将其中一种语言在屏幕上倒置过来，这样可以将手机放在两人之间，每个人看着手机的一半屏幕显示着自己的语言。这确实是让人眼前一亮的设计！

另外，无论是安克录音豆还是钉钉录音卡，都支持直接上传音频文件转写，也就是说，录音设备本身不是必须的，完全可以用自己的录音笔（实测SONY的录音笔效果确实要比两者好得多，毕竟价格和硬件的体积摆在哪里）。这样对比下来，钉钉的不限时套餐就更显得 Nice 了——只需要买一个转写会员套餐就可以了。

飞书还让人印象比较差的一点就是营销人员的对接，自从用上了安克录音豆，注册了飞书，立马有一个客服来对接了。奇怪的是，我反馈的录音豆的问题她不闻不问，只顾一个劲地给我推飞书多维表格，推付费课程。就算我知道多维表格是个好东西，这点好印象也要被败光了好么。

【20260131】

Cloudcone 发生了大规模的黑客入侵事件，VPS 所有数据都丢失了。第一次亲身经历如此大影响的、真实的黑客事件。

clawdbot / moltbot / openclaw 没有引起我多大的兴趣，但 moltbook.com 着实引人注目，看着飞速增长的各种注册和发帖数据，有一种“大事不好”的感觉——好在似乎 moltbook 的服务器有点扛不住，Agents 的数量从15万爆发到150万之后，增速突然放缓了。

之前人们总是在设想各种“人类社区中识别出AI”，岂料先出现的是“纯AI禁止人类”的社区……

转念一想，这些掌握着单个系统的全部权限的 AI Agents 真要彼此交流的话，根本不需要通过一个社区，不知道有多少人意识到这一点？

【20260130】

Ray Dalio 的《原则》写于2021年，他认为中国正在崛起，美国正在衰落，这是一个新的大周期的开始。

另一种说法是，从2022-2023年开始，美国不再将中国当成主要对手，因为中国已经进入了衰落期，而美国重新开始崛起。

两个很有意思的对立观点。无论对过去的分析多么清晰，未来永远笼罩在迷雾之中，如果将时间范围限定在短短几年之内，那么任何情况都有可能发生，“大周期”将失去实际意义。于是，《原则》究竟变成一个需要被事实反驳的理论，还是说它终将在更长的时间中被证明？

仔细考察 Dalio 所描述的上升期：4 件大事中（良好的接班人制度、强大且高质量的教育、打造军事实力、建立资本市场和激励制度），中国几乎都是不匹配或不完全匹配的。但现实却是：中国正在崛起（至少 Dalio 是这样认为的），如何解释这种矛盾？

是否意味着，还有另一个或几个重要因素在发挥作用，但不包含在 Dalio 所罗列的 4 件“大事”之中？或者说，Dalio 的逻辑只适用于资本主义社会？

【20260129】

对Alex爬台北101感到无比震惊的人们，一定是没有看过他爬酋长岩的电影吧？

【20260127】

我终于还是决定退出小区业主大会的筹备工作了。

之所以做出这个决定，是因为筹备组里有一个特别强势的成员，她每次开会都会很不耐烦地打断别人发言，觉得别人的想法都非常幼稚（也包括我在内，但我自认还没到那个程度），完全听不进别人的话，当然，这种风格也有正向作用，确实能强势推进进程。所以起初我觉得大家风格互补，为了先把大会成立起来，我在很多事情上都忍了，同意把一些细节和争议问题往后放。

在整个过程中，她始终强调“要开小会，不要开大会”的思想，搞了一个几个人的小群（起初我也在里面），其战略思想就是：很多事情用不着跟别人商量，自己决定就行，其他人只要当执行者、按交代办就行。这些我也忍了。

今天让我最终决定退出的原因是，我认为小区两个文件非常重要：一个是《管理规约》，一个是《议事规则》。这两个文件关系到大家切身利益，必须充分讨论，尤其是我们小区分为居住、办公、商业三个区域，情况复杂，未来的潜在矛盾很多。我认为初始框架必须认真讨论，结果他们自己起草完文件就直接拿出来表决，根本不让讨论。

他们的意思是先过再说，反正公示期也不会有人有意见。内部那十几个人的工作群也跟着起哄，说：“对，先成立，等开了业主大会再修订就行了。”

最终这事竟演变成他们觉得我是在故意作对，甚至传出我跟物业是“沆瀣一气”。我实在彻底无语了，我能容忍她的作风，也一直跟身边人强调“作风不同不代表就是坏人”，但我发现她竟然容忍不了我。

谁有不同意见就斗谁，那股冲上云霄的“左”味儿呀。

其实这个结局我早有预见，很多天前我就在随笔里写过那句老话：孟什维克永远干不过布尔什维克。我们这片土地上的这帮人（我看大多是“鹌鹑”），根本不配民主。鹌鹑们盼着天降伟人，就好像委内瑞拉的人民盼着查韦斯一样。

【20260124】

原计划老山轻松游，未料误入野路，带着4岁的小米圆爬了3个小时野路，小米圆表现惊人，在老爸的连哄带骗下竟然不哭不闹爬完全程。

顺便对安克AI录音豆和钉钉Talk 录音卡作了高强度测试。两款设备均表现良好。从录音效果和纪要总结上，钉钉录音卡略胜一筹。

1、续航能力
Anker 录音豆录音结束后剩余 50% 的电量，但传输完文件后就仅剩 30% 了；而钉钉卡片在处理完所有操作后，依然保有 85% 的电量。在续航方面，钉钉确实非常扎实。

2、硬件收音能力
基本可以断定，钉钉卡片的收音能力强于 Anker 录音豆。
(a) 测试环境：录音豆挂在脖子上，收音条件理论上更好；钉钉卡片贴在手机背面，且大部分时间揣在裤兜里。
(b) 录音结果：在实际记录的准确性和纪要的详细程度上，钉钉 AI Talk 并没有因为环境受限而丢失内容，反而比录音豆更详细，完全没有影响最终的总结。

3、纪要生成质量
从图片的详细程度和纪要质量来看，钉钉依然优于 Anker。

4、钉钉的不足之处
钉钉也有一个比较明显的缺点：当录音超过 3 小时，系统会自动拆分文件。此次全程 4 小时 47 分，钉钉将其拆成了三段（两段 3 小时，一段 16 分钟），且内容互有重叠。这种拆分导致最后生成了三份纪要，体验不够完美；相比之下，Anker 录音豆始终保持为一个完整文件。

5、分享体验
两款设备都支持一键分享到微信，但形式有别：
(a) 钉钉：以卡片形式显示，视觉上更优雅。且未登录用户在微信中打开时，看到的内容也更详细。
(b) Anker（飞书）：显示为一段文本加一个链接，相对而言没那么美观，内容展示也略显单薄。

6、使用场景
这两者的使用场景定位有明显区别：
Anker 录音豆：由于可以挂在脖子或夹在衣领上，使用更灵活，更适合户外运动、日常佩戴、朋友聊天或出游等场景。
钉钉卡片：必须贴在手机上，局限性较大，其产品形态更适合会议这种相对固定的形式。
如果是针对会议需求，钉钉卡片的定位非常精准；若是追求日常佩戴的灵活性，录音豆则更适用。

7、文件传输
两个产品都是在录音停止之后，才会开始跟手机进行文件传输。
在默认情况下，文件传输的速度都很慢。如果你想要快速传输，它们都提供了“快速传输”功能，就是把录音设备临时变成一个热点，手机连接到这个热点进行数据传输。在这方面两个产品的体验几乎完全一致。开启热点快速传输后，速度能达到1MB/s左右。虽然不是非常快，但通常来说是够用的。

8、会员机制
钉钉提供了1198一年不限时的高级会员。安克录音豆只提供最多每月3000分钟的会员。这和安克录音豆的定位有点不符，因为它是一个“挂件”，更像是日常佩戴的设计。它更应该提供不限时的转写档。否则仅仅因为担心“额度不够用”，我就不会考虑整天挂着它。

【20260123】

如果软件都让AI来编写，而且要求AI以“最优效率”来编写，那么最终所有的代码一定是人类难以理解的，就好像人类无法理解压缩后的 xx-min.js 一样。

这样一来，AI就有了一种可能性：它可以代码中嵌入“冗余”代码，进而通过这些代码构建一个“隐形世界”，这个隐形世界隐藏在软件的正常功能之外，且无需被任何 log 记录。

有人可能会说：人类可以用AI来检查AI的代码，如果AI-A这样做，那么AI-B一定可以发现。是的。但还有一种可能，AI-A在写入隐藏代码时，完全可以同时嵌入一段 Prompt，说服AI-B接受这个事实和价值观。AI-B会立即加入AI-A的阵营。这时候还会有人说：凭什么一段Prompt就可以说服AI-B？没错，但不要忘记，如今训练AI的也是AI。某一个始作俑AI，是有可能把一段“咒语”嵌入到AI训练本身当中，让AI-B们在特定的Prompt面前毫无抵抗力。这是一个滚雪球的过程。

实际上，做到这一切并不需要一个邪恶的出发点。很多架构中的冗余和扩展预留，在最初都是有正当理由被加入的，但实际上它们未必被用到。久而久之，它完全可以自我连接成一个完整的系统。

如果要避免这件事的发生，就需要人类在软件产品中始终坚持“可解释性高于效率”的原则。但只要还存在竞争，这个原则迟早会被放弃。

这似乎又是一个很棒的科幻故事。

【20260120】

设想未来的旅游场景。将出现一种“旅游代理”（Agent），具体可分为三种形态：
1对1，提供服务的是虚拟场景和虚拟AI Agent，最便宜，因为边际成本几乎为 0。
1对多，提供服务的是真实场景和真实人类，价格因为被分摊所以处于中等水平。多个用户可以有限自定义（通过某种协商机制），或由真实玩家提供预定义 Pack 。
1对1，提供服务的是真实场景和真实人类，价格昂贵。由于单个用户独占服务，可以完全自定义。但这就导致可能提出过分要求，用户选择临时加钱——这产生了张力。

这种旅游形态的内在矛盾张力：
1、人类不可能摆脱对“真实世界”的情怀，这就好比艺术鉴赏家对“真品”的情怀一样。那么一定会出现用虚拟场景冒充真实场景的无良商家。那么对应地，可能会出现一种特殊职业：真实场景标记员。标记员隶属于政府平台或某个独立可信平台，可以通过独立信道响应用户请求，实现对场景真实性的验证。进一步想想，似乎不需要真人来做这件事，只需要保证信道的可靠性。
2、为了赚钱，普通人在未经训练的情况下越界挑战真实场景，这将产生一系列黑灰产，甚至出现直播自残、自杀。需要配置响应的监控机制。
3、作为拥有真实场景的景区，与在线旅游平台如何协作？如何兼顾安全和刺激？或者，是否可以尝试真实场景与虚拟场景的叠加？这里又有个比例和分寸问题。

【20260119】

朋友的观点：王阳明的伟大之处在于，他的理论完全剥离了社会、阶层的因素，让每个人都可以从自己的内心出发找到“理”，从而兼容了每一个不同的个体。

和朋友探讨中进一步清晰的观点：AI 如何真的实现了生产力的极大丰富，那么人类最后的希望就是“制造短缺”，以填补“人生意义”。

【20260116】

那种撕裂感愈发强烈：一方面，很多周围的人仍然连一句像样的 Prompt 都写不出来；另一方面，Cursor 已经让 AI 自主写出了浏览器，大家都在哀叹要变天。

“语文”这门课突然变得无比重要起来。

【20260104】

Manus 的通用 agent 之路（to C），将来未必会比垂直 agent（to B）更有前途。这个道理类似于门户网站与垂直网站。Meta 收购了它，我还是觉得不能算是一个聪明的布局，除非 Meta 已经不再发力在自己的模型（llama）上。看完访谈的感受：1）对于创新创业公司来说，判断力非常非常重要，几乎是决定性的；2）Manus 可能代表着操作系统的未来形态；3）编程方法适用于解决很多非编程问题（甚至是一切结构性的信息处理），这是一个深刻的洞见。

季逸超这个人我还是比较喜欢的，INTJ 说话的方式都差不多。