2026-lucyqin的日常

【20260420】

表格的问题已经基本解决了,非常稳定。裁图的问题还有一点尾巴。实践证明 Pro 账号的 Codex 根本不需要担心额度问题,根本用不完。换成 GPT-5.4 xhigh FAST 的顶配模式,高强度没日没夜地跑,还是只能用掉大约 2/3 的额度。

扫描版 PDF ocr 的 Python 已经 38300 多行了。各种情形下的判断和排列组合,即使写成逻辑树伪代码看上去都头晕,更别说自己去写了。

这段时间的感触是,即使只是给codex当监工也是很耗人的事……确实 AI 能帮人做很多事,但因为 AI 你总想在一周内干完以前要一年才能干完的事情。又不能完全放手,因为还需要跟上它的逻辑脉络,这样才能在适当的时候干预和调整方向。比如,为了避免它总是在各种裁图阈值调整上原地打转,我要求它增加了全部图片的 trace 机制,以精确命中修改某一个函数时的影响面,从而可以做准确的关联性回归。

17:00,终于把整本《公路立体交叉细则》都跑通了,复杂图、表、文混排,一次生成带图表 Markdown,内容全部正确,且都使用通用逻辑。134页,23分钟,时间也在可接受范围内。

【20260419】

马斯克宣布了 Terafab,正式进军芯片领域了。我莫名有点不好的预感,他这次还能顺利搞定一切吗?

Dwarkesh Patel 对黄仁勋的采访有点意思,在讨论到是否应该对中国禁售时,老黄一度红温。争论围绕一个悖论:1、卖芯片,那么中国研发能力增强,可能把AI武器化;2、不卖芯片,则一方面美国失去这个超级市场,另一方面中国会另起炉灶(没有什么能真正阻止中国),导致脱离美国的技术体系,最终还是形成对立局面。黄仁勋认为应该选择 1,因为中国会因此始终依赖美国的技术体系,从而确保美国始终领先。当然也有商业立场的因素。

【20260414】

迭代超过 100 轮,干掉了一周 Codex 额度的一半(俺是 Pro 账户),代码量已经超过 2 万行。没想到一个扫描版 pdf 的 OCR 要应对如此之多的逻辑判断。中间版本已经稳胜WPS,但离我的要求还有一段距离。已经看到曙光了,感觉最终能走通。

【20260409】

Gemini CLI 刚出来的时候,我就在想,这样的形态将改变未来人们使用电脑的方式。 当然,Gemini CLI 失败了。后来 Codex CLI 出现了,接着 Codex App 又出现了。Codex App 一旦用过以后,你就会发现不需要再用 Codex CLI 了。 它的使用场景是如此之多,且充满想象力。现在觉得 OpenAI 押注 Codex 是对的,当然,Claud Code 也是一样。

国内好像是不是还没有类似的工具?

qmd 在低性能电脑上执行还是颇费时间的。实测 4090 几乎一瞬间就完成了,但 3070 需要1分钟以上。这样一来,每次对话都更新 qmd 是不对的。正在调整策略,让它每天更新一次即可,同时调整了针对不同显存的 embedding 参数策略。

扫描版 pdf 想要完美识别表格,也是很大的挑战。更换了多种方案都不是很理想。Ollama-ocr 只能提供基础能力,还有一大堆难题,比如合并单元格要用 html 格式存储;表格中的图片要单独裁出来;本地tesseract 能力有限逐格扫描效率太低……等等。Python 已经写到了 4000 行。 实在不行,可能还是要回退到存储整页图片的方式,从回答用户提问那个层面入手,让识别出来的文字只用作索引,真正回答问题还是根据PDF导出来的整页图片。但这个方案显然没有那么优雅,除非迫不得已,不会真的这样做。

【20260408】

拯救飞行员,花费大代价,非常好,干的很漂亮。但:1)换其他总统在这种情形也会这么干,能不能干的很漂亮另说。2)这事儿必须得干,否则飞行员被抓住,后果无法承受,特别是对川普的政治利益来说。所以神话川普没有太大必要。美军的这种精神是值得大力赞扬的。

对  LLM wiki 系统进一步研究发现,这种非 RAG 的检索,始终是基于关键词的,虽然 Codex 可以自动根据你的语义用很多潜在可能的关键词去检索,而且会对命中的结果进一步分析并拓展关键词,但本质上仍然是关键词,而且对命中结果有数量上限。这从原理上就使得它对海量文档的支持不会好(虽然现在还远远没有海量文档)。考虑到我想要搭建的行业知识库可能拥有数千、上万甚至更多的文档,这种检索方式迟早要出问题。 一番研究后,又上了 qmd,在既有架构上又增加了一层 embedding 向量数据库,为每一个 markdown 文档做一份 embedding。 未来可以根据文档的结构,进一步将 qmd 的 collection 也拆分,这一步很容易做。

现在知识库已经支持了三层检索:优先 qmd,其次 FTS5 ,最后才是基于 file 的检索。实测效果极佳,这样就具备的非常大的可拓展性:未来即使有了海量文档,也能迅速命中 source 文档了,结合有效的文档分层结构,应可很大程度上避免上下文忧虑。1 GB 的 md 文档,对应的 qmd 数据库估计在 400MB 左右,空间上是没有问题的。

感觉还是轻量级别向量化+结构化wiki 这种比较适合个人机器,Karpathy 大火估计也是因为这个原因。

【20260407】

昨天研究了一天 Andrej Karpathy 的知识库搭建(LLM Knowledge Base),实操可行,效果很好。与RAG方案相比,最大的优势在于可便捷地持续迭代。

karpathy提供的只是一个思路框架,但有很大的想象空间,我在他的基础上搭了一个个人库,给它提供了几百万字的个人资料。又在我自编的各个系统上全部加上了一键导出markdown文档的功能。现在codex,应该是最了解我的“人”了,甚至比chatgpt还了解。

搭了一个交通行业知识库(雏形),driven by codex。文档这块的门槛是。要把word,PPT,PDF等,转成markdown,写了几个脚本,搭配ollama,基本实现并不难,难的是提高准确率和表格、图像的识别。Ollama-ocr 用的是 Qwen2.5-vl-7b 本地模型,在我的机器上较好的平衡了效率和质量。

我对 Karpathy 的框架作的一个较大改进是,增加了一个本地的 sqlite 数据库,把所有的原始资料 wiki 还有聊天过程全文存储,增加 FTS5 表,实现超快速全文检索,用 Python 脚本负责操作(LLM来调用它们)。这样做的好处很明显,一方面极大的提高了检索效率;另一方面数据库和文档本身就形成了互为备份的关系,新旧版本因此可以有一个对照。

个人库中还包含了工作的信息,我把项目管理网站中最近正在忙的项目信息一键导出给它,它就已经完全掌握了项目的进展,下一步要做的事情,存在哪些困难。然后我跟他聊工作的时候,他就会提醒我还有哪些事要做,什么什么事做完了没有?我告诉他什么什么事已经做完了,有什么什么进展,它就会自动更新到Wiki当中。配合typeless口述,真的是工作助手的感觉。

现在唯一不足的是不能用手机直接操作它,因为 Codex 是在本地操作本地文件夹的。这时候好像小龙虾才有了一个应用场景。但我还是没有想好要不要装小龙虾,始终担心权限太大(虽然我给 Codex 也是 full access)。

【20260402】

我的想法是:反对一切形式的加速主义。广义上看冷眼旁观也是加速主义的一种。

自己既然不是什么政治家,只是一个普通人,那么日行一善、日拱一卒,但求有一点效果,不用在乎结果。

【20260401】

生活中不可避免还是有一些普通朋友的,聊一些日常,肯定还是世俗的逻辑。

价值观主要体现在人生中重大转折时的选择,如果普通朋友主动聊起这个话题,简单应付两句就好了,不用深入交流。而且通常在这类问题上,很多人交流的目的是“寻求认同”而不是“寻求建议”。这样的情况多了是很烦,所以我是以减法为主,很少做加法。一些所谓“同道中人”,接触之后发现也不过尔尔。

【20260331】

一个真正用起来“舒服”的界面,常常包含了非常多的细节,作为普通用户是察觉不到的,真正动手设计它时就体会到了。所以让普通用户来提需求,特别是界面细节上的需求,这也是一个过高的要求,是一件有专业性的事情。

在疯狂重构 Teamrun 之余,顺手更新了一念:现在输入框可以切换到全屏编辑;增加了输入框内容缓存(不适用于编辑模式)。又更新了个人汽车管理系统:增加了里程/日期历史记录,并可以根据历史数据自动估算当前里程。同时在新增换新可自动带出已知数据,录入换新记录更方便了。根据历史数据自动估算当前里程,这个需求,在新构建网站的时候是不太可能想得到的。改了一轮之后,又突然想到,假如用户手滑输入了异常数据怎么办?于是又补充了异常数据自动剔除的逻辑。但这个还不完美,可能有用户有强迫症(比如我自己),对脏数据耿耿于怀。于是又增加了历史数据查看和删除的功能。有点体会到,为什么类似微信这样的软件,每动一点点都要深思熟虑的原因。

晚上在清理 Teamrun 中的脏数据。之前因为懒得完善管理后台,所以一直没清理。我逐个核对哪些注册用户已经离职,更新他们的状态,或冻结,或删除。几个小时下来,似乎重新经历了一次单位的变革:从团灭的市政版块,到曾经大火最近几年又零零落落的轨道、城建版块,再到已经不复存在的道五所、人数大量减少的道四所……绝大多数人都离职了,少数辗转到了其他部门。对于身处其中的每一个人来说,离职、转部门,换城市,都是大事情,肯定都经历了很多……如果不是有这个整理的过程,不会有这么强的感慨。

想想年初我们还新成立了人工智能中心,到现在没声音没图像,也不知道具体是干啥的。世事的变幻速度加快了,而年纪增加,对时间的感知又迟钝了。两个因素一叠加,就感觉时光飞逝,而窗外物换星移。

【20260330】

朋友们因为对张雪峰看法的分歧又吵起来了。吵着吵着,又回到了老生常谈的“言论自由的边界”问题上去了。

首先我理解“上纲上线”这个词,是用在关系比较密切或者能互相影响的人身上。比如说上级对下级,或者同事之间。因为这种上纲上线可能会带来直接的影响。而对于网友的评论(比如像杰哥这样评论一下张雪峰),只要不是传播明知是假的谣言,或者抱有故意的恶意去中伤,我觉得都属于言论自由的范畴,不应该用这个词。

第二点,我觉得大家讨论这个问题,其实是站在两个不同层面上的。第一个层面是,如果我们默认“面对现实”或“活下去”是首要前提和最重要的事情,那么很多家长选择咨询张雪峰,是没有太大问题的。当然这一点也要看具体情况,有不少家长并不是活不下去,并不是条件差到那个程度,而就是为了做人上人,为了卷;第二个层面(这也是我跟杰哥观点比较一致的地方):我们不能仅仅从现实角度出发去考虑所有问题。因为这样做会导致世界的自然平衡被打破。尤其是当你通过张雪峰这样的人,获得了一个直接的指导或者高度的信息提炼之后,会让本来丰富的赛道,变得只剩那么几条;会让本来存在资源门槛的专业,门槛变得更高;会让本来因为竞争过于激烈而要进入“被平衡周期”的专业,陷入更加激烈的竞争, 可能会面临在几年内就急剧滑坡的风险,比如说土木专业;也会让一些可能赚不到太多钱的冷门专业,变得更加冷门。概括一下就是,这是一个正反馈机制,会加剧系统的失控。

这不是世界本来应有的样子。

两种层面不在一个维度,表面看观点好像是相反的,但其实不冲突。大家如果要要深入探讨的话,应该先约定好,究竟是在现实逻辑下讨论,还是在哲学层面上讨论。这样就不会那么针锋相对了。

回到家长们的心态,我当然觉得也是有问题的。实际上很多资讯的获取有那么困难吗?确实只有从张雪峰那边才能获得吗?不是的。说穿了一个是懒,不愿意自己去收集整理;另一个是一种“我花了钱了,别人保证了,我就心安了”的鸵鸟心态。这样的家长在孩子的成长路上,能起到多大的正面作用呢?我觉得比起学校的教育,家长的榜样效应占比是更大的。

另外,关于张雪峰的事情为什么讨论得这么多,为什么会出现“十里长街送雪峰”的情况,以及为什么要神化他?我觉得可以从两个角度来看。从身处其中的这些人(比如家长们)来看,是因为情绪太压抑了,需要一个出口。这就好比一个已经打满了气的气球,突然被针戳了一个孔,所有的气都会从这个孔喷出来。从网友的角度来看,其实这已经不是第一次了。每当有热点出现时,都会在短时间内引发极其热烈的讨论,好像所有人都在关注同一件事。这并非个别现象,主要是因为我们的信息被操弄了——很多本来可以看到的信息看不到了,导致关注的能量只能集中在少数允许被传播的事情上。这就好比一只坐井观天的青蛙,突然有一天看到井口飞过去一只大雁,就会觉得太激动了,甚至能讨论两天两夜睡不着觉。但如果你走出这口井,就会发现天上每天都有各种各样的鸟飞过,并没有那么稀奇。就是这个道理。

【20260329】

我经常引用张一鸣的那句话:“你唯一的真正优势是对某件事的理解”。那怎样才算是深入理解了?

应该可以设想一套标准(或思考角度的通用模板),来衡量对一个事物的“理解”程度。否则易出现“以为已经理解了”,之后又恍然大悟“原来还可以这样”。 比如:优点是什么;那如果没有它,会有何影响?它的优点发挥的前提?太多了会怎样?有哪些变体?将来会如何?谁受益,谁受害?所有干系人的态度?需求和市场在哪里?规模几何?等等。

凌晨已经将重构后的 Teamrun 上线了。还是要在真实环境中,才能继续暴露更多的问题。

【20260325】

听了《太阳之子》,感觉是,杰伦你还是别发新歌了,在咱们的记忆里留点好印象吧。一首《以父之名》已经足够你名垂青史了。

婉拒了杰哥的直播邀请。最近确实关注时政少了,这方面的思考也少了,关于伊朗、油价,好像也聊不出什么有内容的东西。“看世界”、工作、IT,如果说主要精力放在其中两样上,那么第三样就没办法再投入很多了,同时只能较好地兼顾两者。

话说 Codex 的额度真是慷慨,作为 Pro 用户,每天肝到凌晨两三点,可用额度几乎就没有低于过 90% ,有点像在大海里游泳,额度无边无际。可能是因为还没有用上 Sub Agent 的原因,当然更有可能是我自我感觉的“大项目”在专业人士眼中仍然只是小卡拉米罢了。

Vibe Coding 另一个好处是,可以很好地把碎片时间利用起来了。连航拍交叉口的等待期间这 20 分钟都完全可以利用上。平时想到什么就随手一记,累积几条以后就集中一发,20分钟后看结果。连中午去食堂吃饭,都习惯了先安排一个任务给它,不然这 20 分钟就浪费了。

【20260324】

我很不喜欢张雪峰,对他的死也无感。当然也不至于兴高采烈,只是单纯的无感而已。

他的职业毫无光彩可言,不过是在这个俗不可耐的世界苟且偷生,每个少年的理想、个性与兴趣,本就已经被这个社会蹂躏得所剩无几,他还推波助澜,助纣为虐,以焦虑为卖点,以需求为理由,以现实为借口,赚着那点流量与赃钱——当然,有人会觉得我的观点是“何不食肉糜”,但这个世界本来应该具有足够的多样性,张雪峰们的存在会进一步摧毁这种多样性。

死者为大,这个我不太认同,他活着还是死了,我都是这个观点。他的猝死对于他的亲朋好友来说是噩耗,我这样的陌生人没有共情。我也有点奇怪为什么大家都这么热烈的讨论这件事。

【20260322】

这几天把项目管理网站重构成  PHP + SQLite ,同时决定把上古的 Ueditor 替换成 TinyMCE。之所以不用 CKEditor,因为后者竟然不支持附件上传……对不起,支持但那是 Premium 功能。

vibe coding 真的是停不下来,那种言出法随的感觉太上瘾。以前很多想法是有,但对于一个仍然坚持使用纯文本编辑器编程的人来说,除非迫不得已,绝大多数情况下都懒得去做,即便做了也未必完美。现在则完全不同了,I believe I can fly 了。

也决定对原先项目管理网站中用不上的部分功能进行精简,比如“个人博客”。之前留在上面的几篇,还有点价值的就搬到这里。

旧文存档:为什么我们都没见过外星人?(作于 2010-2013年之间)

想象中,仅银河系,就有2000亿颗恒星;而像银河系一般的星系,又至少有1000亿个。地球不会那么孤独,宇宙中应该还有很多外星人才对。

想象中,这么多外星人里面,总该有一些的科技是比我们要先进的(至少一半吧?),掌握了长途星际旅行的科技,以至于他们可以比较容易地造访地球。

对于地球这么一个后进分子,外星人说不定会很好奇。也许外星人会派出一个科研小组,整天坐在飞船上绕着地球转啊转,同时用各种手段探测、分析着人类。偶尔也抓两个人上去,解剖一把什么的。

但实际上,除了一些似是而非的传说,没有人真正见过外星人。为什么外星人不直接了当地把飞碟停在天安门广场,然后跟小胡同志say hello呢?他们为什么要把自己搞的这么神秘?

有一种说法是,外星人早就来了,他们坠毁在地球,但政府掩盖了真相。另一种说法是,外星人早就来了,但没有人发现他们,他们说不定已经混在我们之中。

只要稍微动脑子想想就知道,这两种说法都是站不住脚的。外星人长途跋涉了可能数千光年,途径几百个恒星,说不定还近距离观察过黑洞,结果一不小心坠毁在地球?地球怎么看也不像是如此特殊、险恶的星球。能量耗尽?那更是无稽之谈。要说外星人偷偷摸摸地混进人类社会,那更让人费解了,且不说外星人是不是都像变形虫一样可以随意幻化人形,退一步说,他们有这个必要吗?

我认为,其实真相很简单:外星人压根没来过地球。

其引申的真相是:有能力进行星际旅行的外星人,极其少。

来看看我们人类自己。从工业革命到登上月球,大概也就用了200年时间。无人探测器已经登上了火星,人类想要上去,也不过是时间和兴趣问题罢了。就算是飞出太阳系,估计也不是什么难事。

这样说来,既然星际旅行如此容易,那么为什么说,有能力进行星际旅行的外星人,极其少呢?

我们仔细考虑一下宇宙的尺度。最近的恒星距离我们4.22光年,我们即使以光速飞过去,也需要4.22年的时间。但一个可能住人的行星距离我们也许更远,maybe 1000光年之外。也许外星人无法长途跋涉如此之远的距离,还没到目的地,他们的生命维持系统就出了问题,集体挂掉了。

但别忘了相对论。假设外星人能在很短的时间内将飞船的速度加速到接近光速,他们就同时解决了时空两个问题。接近光速的飞船内,时间将减缓流逝,在极端接近光速时,或许飞船内只感觉过了1秒,飞船已经飞行了数千光年。达到此种科技程度的外星人,我相信是必然存在的。

照这么分析下来,地球应该比现在热闹的多,熙熙攘攘挤满了外星人,没准一大半是星际销售人员,喋喋不休地向地球人兜售高科技玩意儿。显然事实并非如此。

是什么阻止了外星人?同样的,我们可以从人类自身来寻找答案。人类是否具备了探索整个太阳系的能力?答案是肯定的。但人类是否打算本世纪内搞定整个太阳系?No。中国不会这么做,因为玩不起。美国不会这么做,因为同样玩不起。

只有“地球政府”玩得起。全球统一之后,人类才会把目光射向太空。那么,问题在于:谁来统一地球?美国吗?

让我们回到资本主义原始积累阶段,大英帝国疯狂的扩张,哥伦布发现美洲大陆欣喜若狂。是什么驱动着人类的扩张欲望?答案是资源。刚刚征服的处女地,遍地都是黄金。但,现在已经时过境迁。

美国不会再跳出来征服世界,而是玩起了经济游戏,因为,这才是对美国利益最大化的策略。通过经济手段,美国能谋取巨大的财富。而征服一个已经被高度开发的地盘,首先要消耗大量资源,其次要承受国际舆论压力,再次很容易被群起而攻之,从任何角度来说,占领新大陆的故事都不会再次上演。

举个直观的例子,处女很值钱,但是上过之后,再反复自己上就没意思了,还是卖到日本拍AV更有经济效益。

这样的局势,在目前地球资源尚未完全匮乏的时候,能够一直保持下去。而一旦资源耗尽,战争必然爆发,统一全球也就是必然趋势了。可以想象,在一片荒芜的地球上,残存的人类才能第一次携手合作,征服宇宙。

OK,经过漫长的岁月,人类终于在数千光年之外,找到了适合居住的星球。但很遗憾,上面已经有人住着了。你能想象,此时人类会降落在星球最繁华的地带,然后说“hello,may I live here?”

不会的。假设这是一个较为落后的星球,那上面即使有智慧生物,他们这辈子终于见到外星人的后1秒,就是毁灭。假设这是一个相对先进的星球,科技比人类还发达,那么恰恰相反,人类在终于发现一个可用的星球,还没来得及说“oh yeah”的后1秒,同样是毁灭。

这也就是大刘《三体》中所谓的黑暗森林法则。

或许还有一种可能性:我们和外星人的科技旗鼓相当?嗯,有可能,但可能性微乎其微。让我们再次回顾自己,从工业革命到登上月球,人类只用了200年。从发明文字,产生文明到现在,也不过区区5000年。而地球的历史是45亿年,即使复制10000个一模一样的地球,都不可能出现两个科技接近的人类。

换言之,一个文明,只需要比另一个文明领先一万年,那么这两个文明就不可能共存在同一个银河系。

现在再回头看我的第二个结论:有能力进行星际旅行的外星人,极其少。并不是没出现过,而是,很杯具的,都被消灭了。

假设人类运气很好,在1万年内,没有被消灭。那只能说明至少银河系内,人类真的是最先进的文明。然后接下来,人类为了更多的资源,占领银河系,消灭其他所有文明。

现在,就让我们庆幸,不要被消灭,让我们撑到消灭别人的那一天吧。建议尽情地挥霍资源,地球资源有限,再节约也撑不了多久了。相反,资源早一天耗尽,全人类就会早一天飞向太空。

旧文存档:永存,还是毁灭?(作于 2010-2013年之间)

这两天第一次看到《环球科学》这本杂志,看封面感觉是那种小摊八卦杂志,披着“科普”的外衣,干着娱乐的勾当;翻翻内容,颇感诧异,想不到还有这么高端、正统的科学杂志,而且如此的前沿,注重创新,令偶爱不释手,如痴如醉。

有一篇报道,关于线虫的进化,是科学家首次观测到复杂生命体的进化过程。实验方法其实很残酷,对于线虫而言,绿脓杆菌是致命的,感染了绿脓杆菌的线虫将在几分钟内死亡,而实验正是将绿脓杆菌与线虫放到一起。152个培养皿中,151个中的线虫全部死亡,令人惊异的是,剩下的一个培养皿挤满了存活下来的线虫。检测表明,变异的线虫体内的蛋白质与原先的线虫至少有7处不同,这几乎可以判明一个新的物种。变异后的线虫显然更能适应恶劣的环境,不仅不再惧怕绿脓杆菌,反而以之为食。

Planet Earth中提到了另一种较为缓慢的进化。热带雨林中的冬虫夏草,发现了一种可靠的传宗接代的方式:昆虫。热带雨林是地球上能源、水分最为充足的地带,在这里昆虫的数量多的惊人,仅蚂蚁就多达每平方英里800万只。冬虫夏草散发出来的孢子侵入昆虫的脑部,杀死昆虫后,直接从尸体中生长出来,成熟后断落,释放孢子,进入下一循环。这一全过程被敬业的BBC摄影师全程拍摄下来,令人震撼。事实上,这个机制遏止了昆虫数量的进一步增长。

这两个例子其实具有共通性。很明显,在很多年之前,冬虫夏草的繁殖手段不会是如此极端,但是一个偶然的机会,感染昆虫的孢子获得了成功,随着昆虫种群数量的极速增长,通过昆虫来播种变得越来越可靠而且“经济”,最终,进化使得冬虫夏草最终几乎完全依赖这种方式繁殖。在这里,主要因素在于昆虫数量的增长,使得“昆虫播种”越来越具有优势,在漫长的岁月中,进化造成了这种结果。

在线虫的例子里,起主要因素的是线虫,在面临严峻的生存危机时,绝大多数线虫被残忍的淘汰,在极小的变异概率下,极少数线虫得以存活。这同样是进化论的优胜劣汰的必然结局。

我相信,在大多数情况下,下层种群的庞大数量增长,和上层种群的生存危机,这两种机制的共同作用,造就了大多数的进化过程。线虫的极端例子可以很好的说明这一点:线虫面临生存危机,绿脓杆菌大量存在,于是线虫反过来进食绿脓杆菌。

生物链需要某种平衡。种群数量的极大增长,一方面引起食物的过度消耗,另一方面其本身作为食物引起其食物链上层种群的数量同步增长,这两者都反过来遏止了种群数量进一步增长。也许不一定非要通过食物链的方式,冬虫夏草就是一个典型的例子。

OK,现在说到正题,看看我们人类自身。人类种群的数量目前已经相当庞大,在城市中已经达到相当大的密度,甚至不亚于热带雨林中的蚂蚁。在钢筋混凝土的世界中,作为食物链顶端的人类,似乎不用担心食物链平衡机制。目前地球资源虽然逐渐显得不那么充足,但还没到耗尽的地步,人类似乎还可以逍遥很长一段时间。

但是不要忘记另一种机制。微生物在地球上的数量远远超过人类。当人类的数量越来越多,越来越密集,当微生物的天堂环境(往往是潮湿、阴暗的环境)越来越少,当垃圾处理、污水处理、清洁能源、空气质量控制等等越来越被人类所重视,微生物或许也在加快变异,在某一时刻,一不小心,它们发现人类本身,是另一个天堂。

霍乱、黑死病、天花、非典,一次比一次厉害的瘟疫,已经明白无误的昭示着这个趋势;人类通过越来越先进的技术和预测手段,一次又一次扛住了侵袭。然而,人类的免疫系统也在越来越严密的防护下变得越来越脆弱,就好比为了防止黄河泛滥,一味地加高圩堤,其结果只能是下一次更厉害的泛滥。这仿佛一场赌博,病毒的进化是随机的,可能很温和很易化解,但亦可能很致命很难对付。最大的悲哀在于,人类在这场漫长的战役中,似乎永远只能处于被动挨打的局面。

可以肯定的说,人类在最近的100年内,出现的各种新的疾病,比过去的10000年的总和都要多。层出不穷的新疾病、病毒、癌症,出现的频率和猛烈程度,正呈几何级数的增长。照这种趋势下去,似乎总有那么一天,一场罕见而致命的病毒终将赶在人类发现解决办法之前肆虐全球,杀死绝大多数的人类。小概率事件试验多次,也必然会发生。

当然,即使这种情况发生,有很大的可能它不能杀死所有的人类。正如科幻电影拍的那样,由于变异或者称之为缺陷的某些基因,也许可以抵御病毒。这一小部分人将承担起恢复人类文明的重任。然而,讽刺的是,现代医学正不遗余力的对抗这种变异:癌症的治疗一直是全球医疗机构孜孜不倦的目标。从进化论的角度,癌症,即肿瘤,及细胞的非正常分裂,作为基因变异的一种主要形式,是人类对抗将来大面积瘟疫,在残酷的生存竞争中获胜的很重要的机会。如果人类根治了癌症,恰恰是从另一个角度宣判了自身的死刑。不过,幸运的是,癌症作为基因复制中必然发生的极小数随机差异的体现,从本质上具有随机性,因此本质上根本不存在对付所有癌症的终极方案。

基因测序技术已经发明了若干年,当初的欣喜若狂现在早已冷却。科学家已经发现,将所有基因片段与人类所有病理现象对应起来,是不可能完成的任务。然而,随着全球信息化进程不断发展,信息的整合将给基因学带来新的契机。以Google为首的搜索引擎已经给访问整个互联网资源带来极大的便利。语义网技术的兴起,将进一步、甚至是革命性的为分析整个互联网的数据开创全新的境界。语义网的技术特点将给那些需要依赖海量信息进行统计、分析、甄别的领域带来质的突破。也许很快,有那么一天,人类可以根据基因,了解到人类本身的一切,进而控制人类本身的一切。

那将是伟大的一天,自那以后,每一个人类将都是完美无缺;那也将是噩梦的开始,自那以后,人类面临突出其来的瘟疫,将彻底失去抵抗能力。打个悲观的比喻,截止目前,人类只是一边拿铁锹在挖坑,一边在研究新型的挖掘技术;基因技术的发现好比终于发明出了挖掘机,可以在短短几天内挖出合适大小的坑穴,之后人类需要做的,就是躺进去,把自己埋葬。

《环球科学》是一本需要慢慢咀嚼的书。第一天,我只能读完小半本,那时候我还没有独到《生病的碳市场》一文,也根本没听说过《京都议定书》,就算见到《京都议定书》这个名字,或许还会以为是李鸿章签订的不平等卖国条约。感觉到人类黯淡的前途,我一度觉得非常沮丧。

但很快我看到,人类并没有闲着。《环球科学》列出了一些当前正在进行的最前沿的研究:第一个人造生命的诞生;第一台分子机器诞生;光子操控;量子总线诞生;发现中子的三明治结构;依靠脑虹技术绘制脑神经图谱;无线供电技术;GLAST;LHC……这里面任何一项,都是那么激动人心,它们描绘出一个完全不同的未来世界。

当然,将来的事情,永远比不上已经发生的更能震撼人心,检测表明,南极上方的臭氧层空洞正在缩小,其最薄处的厚度已经从100单位上升至120单位。还记得2000年,千禧年之时,全面禁止使用氟利昂作为冰箱的冷却剂,现在8年过去了,你能相信么?它真的生效了。后来才知道,这一切都归功于《蒙特利尔议定书》。《京都议定书》与之类似,但内容是控制温室气体的排放,减缓全球气候变暖的脚步。不用怀疑,人类可以做到,关键在于怎么做。

不管是《蒙特利尔议定书》,还是《京都议定书》,都通过经济杠杆来实施。以《京都议定书》为例,通过创建原本并不存在的“碳(排放)市场”,给工业机构、政府机构分配碳排放指标,超标的机构必须购买额外的“碳(排放)信用额”,来获得排放许可。另一个替代方式是投资绿色能源、污染处理等,以此交换碳(排放)信用额。这种方案尝试控制全球碳排放总量,截止目前,全球碳市场每年交易达到数百亿美元,按计划,至2012年,全球碳排放总量将削减5.2%。没错,It works。

现在是不是觉得人类还是有希望的?人类高度社会化使得人类已经可以用自己的智慧,影响人类整个群体的行为。这非常关键。OK,总结完过去,我们还可以稍微展望一下未来,看看在不久的将来,我们可以做什么。

人造生命、分子机器、脑神经图谱……这些都意味着人类在认识自身领域的突飞猛进,当人类真的可以做上帝做的事,他不是阻止了进化,而是进化改变了方式:从天择进化到人择进化,显然后者拥有无可比拟的优势。

光子操控、量子总线,这个领域的目标很明确:量子计算机。量子计算机和传统计算机具有本质上的不同,最主要体现在并行计算和量子态模拟上,前者带来相对传统计算机完全不是一个数量级的性能提升;后者将直接带来人工智能。

GLAST、LHC,前者是一个望远镜,后者是一台强子对撞机。GLAST可以观测到此前从未观测过的高能伽马粒子波段;LHC则可以将基本粒子加速到此前从未达到的能量,对撞可能产生此前从未发现过的神秘粒子。天文物理学家和粒子物理学家从未像现在这样紧密联系在一起,两者的结合将为揭示“暗物质”的特性提供很多直观依据。因为GLAST和LHC,08年让整个科学界期待。

记得在某篇科幻小说中,掌握了十一维空间技术的外星生命手指太阳,太阳即变为绿色。所谓“神”,无非是更高的技术罢了。若人类可以完全了解“暗物质”,那么目前的若干种宇宙模型将最终确定为一种,关于星系速度与宇宙质量的矛盾亦将迎刃而解,换言之,“大统一”理论的出现将指日可待。届时,人类距离揭开宇宙的终极真理将只有一步之遥。

在如此美好的前景里,人类将不再是人类,简直要直接飞升为传说中的“神”了。此前对人类前景的悲观设想,似乎又被冲淡了很多。人类究竟能否赶在自身毁灭之前,强悍到完全掌握自身的命运呢?

也许我们可以用一个坐标系来表示,X轴代表时间,Y轴代表技术发展。所有的生命随着X时间轴的增长,同时拼命向Y轴延伸。然而,这里存在一个Y=aX的方程,它绘出一条斜向上的射线,这条射线即为“永存,还是毁灭”的阙值。当然,就目前的经验而言,可能是Y=2X,或者3X,甚至10000X,这条线可能是一个非常陡的射线。险恶的宇宙留给“永存”者的机会肯定不会太多。

地球上,乃至全宇宙出现的各种各样的、绝大多数低阶生命体,很不幸的位于这条阙值线以下,譬如恐龙,又譬如地球上眼下濒临面绝的那些物种,它们最终走向毁灭。而人类会是那个幸运儿吗?可惜的是,我们目前掌握的资料太少,也许当人类的足迹遍布上千个星球,目睹上千种文明的兴衰,我们就可以总结出某种评价公式,从而制定长期发展目标,避免衰亡。

有生之年,能有幸见到第一代量子计算机,余愿足矣……

旧文存档:关于力的本质及其他(作于2010-2013年之间)

看完《时间简史》,想到至今未能统一的四种力,自己也忍不住做一下思维体操:什么是力?

客观的讲,力是一种难以解释的现象,两个物体,本身没有任何接触,却能彼此产生力。力通过不同的力场发挥作用,而力场本身是一个虚拟的概念。

也许,力,只是另一个更为本质的特性的一种表现形式?

让我们来看看“力”都干了什么。力改变物体的运动状态。那么是不是也可以反过来说,物体的运动状态改变,表现为力呢?

听起来不错,那么,“运动状态”是什么概念?首先来看看什么是“运动”?物体随着时间的流逝,转移自己的空间,称之为运动。根据相对论的结论,物体的速度越快,则时间流逝速度越慢。当物体达到光速,则时间流逝停止。

且慢,时间停止,换言之,我们可以称该物体“失去了”时间。那么它得到了什么呢?随着速度的增加,物体在空间中移动的越来越快,也就是说,在单位时间内,物体占据了越来越多的空间,是否我们可以说,随着速度的增加,物体是在用“时间”换取“空间”呢?

这个说法其实并不准确,因为根据相对论,实际上在接近光速运动时,物体反而占据了更小的空间,物体的尺度在达到光速时变为0。那么,有什么东西增加了呢?答案是质量。

随着速度的增加,物体的质量不断增大,同时,物体的时间变得越来越慢。这听起来似乎暗示了,物体的时间与质量是一对相关量。就仿佛天平的两端,两者可以互相转换。

互相转换即意味着,这两者本质上也许是另一种更为本质的属性的不同表现形式。质能方程E=mc^2标明,质量即能量。而质量可以转换为时间,那么也就是说, 时间亦即能量!

若将时间作为参数来考量物体的能量,可以得出,物体的能量并不随着力的作用而变化,物体的能量是守恒的,而力的作用,只是使得物体的能量更多的表现为质量,或者更多的表现为时间罢了,反过来说也一样,能量在质量和时间之间转换时,表现为力的作用。

OK,现在我们来分析,为什么会有光速上限。

相对论告诉我们,任何物体的速度不可能超过光速,然而它并未告诉我们,为什么会有光速?

根据量子理论,现在我们知道,时间并不是连续的,而是有一个最短间隔,任何一件事情不可能以短于这个间隔发生。能量不是连续的,而是有一个最小的能量,任何能量只能是这个最小能量的整数倍。现在我们来分析物体达到光速时,究竟发生了什么。

速度的增加使物体不断失去时间,物体达到光速,时间已经停止。如果把这个过程反过来,若物体完全静止(理论上的),那么很有可能,它的时间会流逝的非常快,快到甚至我们根本来不及发现它的存在它就消亡了。然而,它的时间却不可能快到比量子理论预言的最小时间间隔还要短,因此,在理论上的绝对静止状态下,能量通过时间表现出来的并非无穷大,而是一个可以计算出来的值。这个值加上物体的静止质量,得到物体的总能量值(并非无穷大)。

前面说到,物体的总能量是守恒的,并不随着力的作用而变化,那么在接近光速时,随着物体质量的增大,物体的总能量越来越多的表现为质量,最终在某一速度下,总能量几乎全部表现为质量,而时间流逝的如此之慢,以至于只占据了总能量的一小部分。这时物体的速度已经不可能再增加,因为质量继续增加,将使得物体质量大到甚至超过物体总能量,而这是不可能发生的。

现在的问题是,如何得知物体的静止质量?若我们可以获得质量—时间方程,那么根据量子理论的最小时间间隔,我们可以推导出一个正常世界中的物体,其总能量分别表现为质量何时间的分配比例,从而最终得到物体的静止质量(也许是0?)。最终可以得到时间—能量方程,我们也许可以证明,时间最小间隔的存在,导致了光速上限的产生,这两者是互为和谐的。

时间和能量的本质上的统一,也可以通过时间的最小间隔和能量的最小单位来体现,最小单位的能量一旦存在,及时没有静止质量,全部体现为时间,那么这也就是时间最小间隔。

从这个意义上讲,我们还可以证明为何宇宙会有这么长的历史和这么多的质量;从虚空中分裂出来的正反宇宙可以很小,也可以很大,当然后者的概率也非常低。然而我们却只有可能得到一个大质量的宇宙,因为小质量的宇宙注定是短命的,因为它所有的质量即使全部转换成时间,其时间也短的可怜。在某个极小的概率中,虚空中诞生了正反两个很大的能量的宇宙,这一大团能量(正能量,或者负能量)按某种比例表现为质量与时间,而这些物体(本质上是能量)以大爆炸的形式飞奔,因为若非如此,他们时间就会流逝的更快从而加速消亡。这也许暗示了为什么我们总是观测到一个运动中的宇宙。

现在,仍残留两个问题:1、为什么必须要有时间最小间隔?2、为什么要有力?

旧文存档:送兔子(作于2013年6月)

犹忆金蒲初识兔,欲语还羞,怯赠东江鱼。
损友调教千百度,竟引豪情无数。
六年弹指一挥间,物是人非,情路总多艰。
端午聚首不说愁,他日笑饮岳阳楼。

旧文存档:新型文件系统解决网络带宽(作于2010年5月10日)

大量的带宽是如何被占用的?

下载。无论是浏览新闻,还是下载电影,在线游戏,其本质都是下载。

那下载的本质是什么?

复制。每次下载,1份文件将复制为2份。海量的下载,同样的文件被复制了无数份。无数份完全相同的文件,通过下载,存储在无数台不同的计算机当中。在这个过程中,占用了大量的带宽。

这个过程真的是必须的吗?

想象一下,假设一种新型的文件存储方式,使得我们除了必要的本地缓存外,多数文件,尤其是大型文件不需要下载。那么,我们每人节省下来的带宽,将可能使的我们每个人的独立带宽扩大十倍。

假设有一台容量极大的中央服务器,存储了所有的文件。通过某种机制,使得每个文件只存在一个副本,用户的复制操作只是复制一个指针。删除也只是删除指针,除非所有的指针均被删除,这个文件才被真正物理删除。

在足够的带宽支持下,用户需要用到这个文件时,这个文件才被实时的传输到客户端。

假设每个人的带宽能达到24Mbps,那么每秒3MB的速度,每分钟180M,一个半小时可以16.2G,即使是1080p的蓝光DVD,都绰绰有余了。

何须下载?

但,如果所有的文件均采用这种方式存储,个人将毫无隐私可言,政府可以肆意妄为。而且,一旦中央服务器被攻陷,则整个网络立即瘫痪。因此,我们可以将这个方案调整得更加和谐一些。

可以考虑以城市为单位,建议市级中央服务器,临近的城市互为备份服务器,同时在省级创建更高一级的中央服务器,为所有市级结点创建第二级备份。

保留个人电脑的存储空间,个人可以选择:是将文件下载到本地?还是在中央服务器上复制一个指针?前者需要占用自己的带宽,而且下载可能需要1个小时;后者完全不占带宽,且只需要0.1秒。我想,除了真正意义上的隐私数据,终端用户会有自己的选择。

其实,这有点类似于目前的数字电视的点播系统,只不过,点播系统是点播影像文件,而该系统是“点播”所有类型文件。

从技术上说,甚至连操作系统都无需安装在本地,用户只需按自己的喜好“点播”操作系统即可。

很多人都有这样的感觉:虽然现在是宽带时代,但2M或者4M的带宽,我们仍觉得不能满足需要。虽然现在硬盘便宜的跟大白菜一样,但1T、2T仍然很快就能塞满。单纯的满足欲望是不现实的,因为人的欲望永远不可能满足。必须另辟蹊径。

我想,比起无限制的加大带宽,增加终端系统的硬盘容量,本文所述的方案才是网络基础设施建设的必由之路。

【20260321】

从人的情绪出发考虑问题,就摸到了权力的本质。权力的重心并不在于过去做了什么,甚至不在于曾经做过什么,而在于让人们相信:未来你能做到什么。所以权力本质上是一种情绪管理。

【20260320】

任何自然语言输入的工具都可能面临 Prompt Hack。而这种输入界面常常是开放的,这让风险大幅增加。人们还没有广泛地意识到这一点。

昨天晚上做梦,梦见自己变成了老年痴呆——手机上字打不出来,怎么打怎么错。怀疑跟脑震荡引起的潜意识焦虑有关。也可能就是单纯的老了。

【20260319】

带有启停功能的车,会在汽车刚刚发动时,以更高的电压往电瓶充电,表现为点烟口电压偏高。一旦超过15V(正常12V),可能会导致逆变器停止工作。 此时只需要稍等10分钟即可恢复正常。

【20260315】

看了 Dwarkesh Patel 对 Dylan Patel 的访谈,突然想到,最近一段时间中国政府对 openclaw 的鼓励政策,仅仅用“蠢”来形容可能是武断的。中国政府也许希望通过这种方式,掀起一轮热潮,给 AI 产业再打一针强心剂,把普通老百姓的力量也调动起来。视频采访对象是专业的半导体研究机构的首席分析师,视频透露了很多数据,以及很多对趋势的分析,能强烈感觉到全球范围内数据中心、能源、光刻机、高带宽内存HBM 等等的极度饥渴的需求,和随之而来的竭尽全力的产能增长。

在这样的背景下,中国的决策者可能会这样考虑:“只要能刺激市场,加大内需,什么方法都可以”。

退一步说,任何新生事物必须在不完善的时候就拿出来卖——否则就失去了先机。所以应该宽容一点。

另外,很多经济学上的洞见,其实就是简单的数学,只要去调查一下,就可能得出很多与直觉不符的结论,比如 dylan 得出的“光刻机才是瓶颈”这个结论。以及,再多想一步就能多看到一步。比如,普通人都知道,DRAM、PC等等产能很多转向了数据中心,导致内存、硬盘等价格飙升;但专业人士能看到“OK,现在这部分产能已经转移得差不多了,接下来增速是不是会减缓?后一步瓶颈在哪里?”

【20260314】

在无序中总是可能涌现出有序。 用熵来定义时间在直觉上就不够“基本”,我认为它完全无法证明时间之箭的方向。 不过,如果“时间”的定义本身就不基本,那么可以说这俩就是一个东西。

【20260309】

这几天问我“有没有养龙虾”的人急剧增加,都把我问烦了。真的很讨厌这种一窝蜂的热度,东西还没搞清楚,需求还没搞明白,看别人都在玩、都在装,自己就跟着着急,然后也想装,还不想花钱。这次还学到一个词:FOMO(Fear of Missing Out),如果仅仅是 FOMO 还好点,起码还是真心愿意付出一点代价的(当然也因此变成了韭菜),那些只想着白嫖的人,就只能用又懒又蠢来形容了。

我并没有装,因为它对我用处不大,风险却增加。对于用过 Codex 或 Claude Code 的人,对 openclaw 不会有太大的兴趣,我日常能够流程化的工作,早已经实现了流程化,本质上 openclaw 除了可以通过 IM 来指挥它之外,其他能力上都是类似的,但却多出了一堆安全性的包袱。

一个显而易见的悖论是,你得把它放到你的主力电脑上,它才能发挥更大的价值;但是你真的把它放在主力电脑上,风险又是难以承受的。同理,你也不会让它去直接上手你跑着重要服务的服务器。对安全的理解与人的性格有关,我是J人,至少现阶段我是不太可能放手让 AI 真正去操作我的主力电脑,让它帮我回邮件、发消息、整理文件的,这是基于我长期使用 AI 对它的能力边界的基本判断。P人可能无所谓吧。

那么,给它一台独立电脑或虚拟机,它在空空如也的机器里又能发挥什么价值呢?

除了本地资料的安全外,另一大风险是网络风险。我尤其要劝不太懂IT的人,轻易不要尝试 openclaw,因为它在安装各种技能,在执行各种“小白指令”的同时,极有可能会开放端口,运行新的、未被安全验证的服务,从而为黑客入侵大开方便之门。一个不懂安全的用户,给一个“执行力超强”的AI发布指令,就好像一个不懂业务的领导在一线随意发号施令,只知其一,不知其二,其破坏性可想而知。

从具体执行任务上看,openclaw 又是效率极其低下的。以“整理网上某个主题的资料”为例,它消耗 Token 的速度堪称惊人,如果使用顶级厂家的 API,一天就能干掉你一个月的订阅金额,成本是直接使用官方 web_search 的百倍以上。这是何苦来由?

虽然 openclaw 已经支持了订阅用户的 auth 登录方式,这似乎可以规避 API 的高昂费用,但这又给账号带来了潜在风险——搞不好哪一天,OpenAI 或 Anthropic 又会把你的 openclaw 活动判定为滥用,一封了之。

如果要说它改变了什么,那就是改变了一部分普通人使用AI的门槛,但也只是一部分真正有需求又不太懂IT的人。这一小部分人有一点IT基础知识,又不足以搭建自己的流程,每天又有高度流程化的工作,那么 openclaw 可以帮到他。即便如此,目前真的能把 openclaw 玩转的人,也并不真的需要 openclaw 才能解决问题——你先试试 Codex 吧,多快好省,不香吗?

目前真正的门槛,始终认为是“人”自己。你到底要做什么?有没有想法?对于你要实现的想法,有没有基本的、有逻辑性的概念和路径?这是真正的门槛。openclaw 不能帮人解决这个根本问题。

国内的大厂迅速跟进,这倒让我有点惊讶。腾讯下场亲自做“小龙虾”,想必会在安全性上更负责任,但一个永恒的新问题出现了:Qclaw 忠于谁呢?细思极恐。

我不禁又回忆起之前同事在使用 ChatGPT PLUS 后的一个评价:它为什么不能直接给我生成 word ?言语之下好像“这个 AI 也不怎么行”。我一时语塞,你发起的深度研究,它辛辛苦苦运行了 20 分钟,给你一篇字字珠玑干货满满含金量极高的 2 万字报告,然后你嫌弃它不能生成可以直接交付的 Word ?你是没有手吗?这是什么臭毛病?

【20260301】

世界秩序不存在了,价值观就崩塌了。 接下来,就是爱憎没有那么分明了,更多的是困惑和迷茫。

并非是为伊朗抱不平,神棍政权万死不足以辞其咎。仅从结果来看,当然应该是大快人心。至于行动的动机,有人觉得,如果不是为了摧毁核设施(午夜之锤已经号称摧毁过了),那就一定是因为伊朗政府对抗议民众的屠杀。

真的是吗?在这种事情上,是否仍然可以坦然抱有“论迹不论心”的态度呢?

【20260228】

美国一家科技公司 block 今天宣布裁员,从1万人裁到6000人。该公司2025年毛利率平均在20%左右,增长势头强劲。宣布裁员后,股价飙涨20%,市值增加了60亿美元。

智能工具大规模替代人工的时代已经来临了。

当生产力过剩,人工冗余,但新的分配方式还没有稳定 这个割裂的过程里会发生什么? 没有工作的人总不能去死,但有工作的人难道要缴纳更多的税? 未来“拥有工作机会”究竟是一件好事还是坏事? 联想到节前我们内部还在做“如何在工作中应用AI”的分享 ——We are killing ourselves.

【20260226】

Nas 硬盘坏了一块,可能造成重要数据损失。“失去后才懂得珍惜”,一下子领悟到既然用了 Nas ,就应该老老实实上 Raid 1(对于两盘位,群晖叫 SHR)。

【20260225】

在美区 Google 账号下,使用网页版 Google Play 管理付款方式,可以添加国内银行卡。(前提条件可能是账单地址必须是美国。) 比较友好的是X 平台,订阅 Premium 可以直接使用国内银行卡支付。

【20260221】

低碳水造成低血糖,起身起猛了,眼前一黑,摔到后脑,摔成了中度脑震荡。好在关键的密码都还记得。观察短期记忆的丧失和逐渐恢复过程也算是个难得的经验。

【20260220】

Binpay的跑路姿势非常专业,先发一条公告,称技术升级需要10天。然后直接跑路……用户会始终疑神疑鬼“它是不是还在搞技术升级”?于是傻乎乎等上个10天。Binpay于是实现了用户的“愤怒平滑”,这种控制舆情的手段怎么那么熟悉?

相比之下,wildcard真算是超级良心了,被打成那样,竟然还能复活过来,给你余额兑现(订阅)的机会。

【20260217】

用5公里PB完成跨年。跑到一半的时候,还有突然响起的鞭炮声为我加油,Nice。

跑步的时候想到,如果AI时代生产力大幅过剩,那么在这种情形下,似乎强分配的社会体制与之更匹配?

【20260216】

全屋整理,一番断舍离,增加了一些年味。

【20260215】

配速如果慢于六分,所谓的跑姿、提髋都是毫无意义的。因为如果速度起来了,自然就提髋了。配速很慢的时候,追求跑步姿势是因果倒置。

【20260214】

Mosavi 从软件设计本身来看是比较优秀的。但它还是坠入了同类型软件总是逃不开的垃圾信息陷阱。再一次验证:“强烈的自我身份认同” + “匿名” = “人性的黑暗面”。

【20260213】

Typeless 的权限之大,确实令人担忧。一旦产生这种担忧,使用它的热情大减。

了解到一款产品的“信任中心”——Typeless的官网上也有信任中心网页,目前,4 项合规性审计中已经通过了 1 项。

【20260212】

想到民主社会的一个 Bug,民粹主义浪潮在民主社会中更容易通过选举强化了领导人的左翼或者右翼倾向。与集权社会中政府可以左右民众倾向的情况相比,很难简单地说哪一种模式更好。

【20260211】

看到三个水枪手在讨论生育的问题。武律师提到,不应该把生小孩和工作对立起来,认为生儿育女和工作都是生活的应有之义。 这句话看起来是毋庸置疑的,但是真的从第一性原理去追究的话,我们不得不追问一个问题:工作,真的是生活的应有之义吗?可能很快就不是了。

【20260208】

实测 GPT-codex-5.3 速度确实快多了!稳准狠,且思考过程全中文,对 Windows 的兼容性似乎也增加不少。又相信爱情(OpenAI)了……

【20260207】

"It's just pretty freaking hot in memphis, so you're going to have like a 40% increase on your power just for cooling. --- Assuming you don't want your data center to turn off on hot days and you want it to keep going. "

马斯克说话的时候,经常会做一些“毫无必要”的假设前提。这恰恰是“第一性原理”思维模式的日常体现。

【20260206】

这个王全章发起的呼吁,简直毫无道理。公安部只是起草法律,又不是审议和通过法律,这么知名的人权律师就这水平?

————

迅雷被实锤替换用户下载的文件。这简直太明目张胆,太过于炸裂,从这件事开始,迅雷真正开始沦为一个流氓软件了……所以,这就是所有优秀国产软件的必然归宿吗?

————

发现低碳饮食已经严重降低了肌糖元与肝糖元,以至于造成明显的神经、肌肉疲劳以及注意力下降后,在 ChatGPT 的指导下调整了饮食,增加了碳水摄入。效果非常明显,今天晚上的 8 km 表现良好。总之,要科学,不能蛮干。

【20260205】

反复研究了两遍《网络犯罪防治法(征求意见稿)》。如果此草案就这样发布,我起码犯了其中的五、六条吧。妈呀还让不让人活了。

得发挥“公民”的自主性。已经反馈了邮件。

【20260204】

果不其然,似乎黄仁勋也开始将赌注从 OpenAI 慢慢转移到了 XAI 上。Sam Altman 这几天明显有点绷不住了。

【20260203】

听说 SpaceX 真的收购了 XAI 之后就觉得不妙,因为这显然会将竞争引入一个极度不公平的新阶段。如果 SpaceX 的太空能源计划全面铺开,人类所有的地面计算中心都将无法与马斯克的太空计算中心相抗衡,而且甚至不具备建立竞争的起点。

戴森地球计划与可控核聚变,究竟哪一个会成功?或者说,哪一个会先成功?真的很难预测,真的很让人期待。

【20260202】

进一步体验钉钉端AI听记的各项功能后,可以得出肯定的结论:至少目前而言,钉钉AI Talk 录音卡比安克 AI 录音豆在软件易用性和以人为本上要强的多,毕竟多经过了几个月的迭代。

举个例子:实时翻译功能,钉钉做到了实时展示双语(比如中英文),然后可以将其中一种语言在屏幕上倒置过来,这样可以将手机放在两人之间,每个人看着手机的一半屏幕显示着自己的语言。这确实是让人眼前一亮的设计!

另外,无论是安克录音豆还是钉钉录音卡,都支持直接上传音频文件转写,也就是说,录音设备本身不是必须的,完全可以用自己的录音笔(实测SONY的录音笔效果确实要比两者好得多,毕竟价格和硬件的体积摆在哪里)。这样对比下来,钉钉的不限时套餐就更显得 Nice 了——只需要买一个转写会员套餐就可以了。

飞书还让人印象比较差的一点就是营销人员的对接,自从用上了安克录音豆,注册了飞书,立马有一个客服来对接了。奇怪的是,我反馈的录音豆的问题她不闻不问,只顾一个劲地给我推飞书多维表格,推付费课程。就算我知道多维表格是个好东西,这点好印象也要被败光了好么。

【20260131】

Cloudcone 发生了大规模的黑客入侵事件,VPS 所有数据都丢失了。第一次亲身经历如此大影响的、真实的黑客事件。

clawdbot / moltbot / openclaw 没有引起我多大的兴趣,但 moltbook.com 着实引人注目,看着飞速增长的各种注册和发帖数据,有一种“大事不好”的感觉——好在似乎 moltbook 的服务器有点扛不住,Agents 的数量从15万爆发到150万之后,增速突然放缓了。

之前人们总是在设想各种“人类社区中识别出AI”,岂料先出现的是“纯AI禁止人类”的社区……

转念一想,这些掌握着单个系统的全部权限的 AI Agents 真要彼此交流的话,根本不需要通过一个社区,不知道有多少人意识到这一点?

【20260130】

Ray Dalio 的《原则》写于2021年,他认为中国正在崛起,美国正在衰落,这是一个新的大周期的开始。

另一种说法是,从2022-2023年开始,美国不再将中国当成主要对手,因为中国已经进入了衰落期,而美国重新开始崛起。

两个很有意思的对立观点。无论对过去的分析多么清晰,未来永远笼罩在迷雾之中,如果将时间范围限定在短短几年之内,那么任何情况都有可能发生,“大周期”将失去实际意义。 于是,《原则》究竟变成一个需要被事实反驳的理论,还是说它终将在更长的时间中被证明?

仔细考察 Dalio 所描述的上升期:4 件大事中(良好的接班人制度、强大且高质量的教育、打造军事实力、建立资本市场和激励制度),中国几乎都是不匹配或不完全匹配的。但现实却是:中国正在崛起(至少 Dalio 是这样认为的),如何解释这种矛盾?

是否意味着,还有另一个或几个重要因素在发挥作用,但不包含在 Dalio 所罗列的 4 件“大事”之中?或者说,Dalio 的逻辑只适用于资本主义社会?

【20260129】

对Alex爬台北101感到无比震惊的人们,一定是没有看过他爬酋长岩的电影吧?

【20260127】

我终于还是决定退出小区业主大会的筹备工作了。

之所以做出这个决定,是因为筹备组里有一个特别强势的成员,她每次开会都会很不耐烦地打断别人发言,觉得别人的想法都非常幼稚(也包括我在内,但我自认还没到那个程度),完全听不进别人的话,当然,这种风格也有正向作用,确实能强势推进进程。所以起初我觉得大家风格互补,为了先把大会成立起来,我在很多事情上都忍了,同意把一些细节和争议问题往后放。

在整个过程中,她始终强调“要开小会,不要开大会”的思想,搞了一个几个人的小群(起初我也在里面),其战略思想就是:很多事情用不着跟别人商量,自己决定就行,其他人只要当执行者、按交代办就行。这些我也忍了。

今天让我最终决定退出的原因是,我认为小区两个文件非常重要:一个是《管理规约》,一个是《议事规则》。这两个文件关系到大家切身利益,必须充分讨论,尤其是我们小区分为居住、办公、商业三个区域,情况复杂,未来的潜在矛盾很多。我认为初始框架必须认真讨论,结果他们自己起草完文件就直接拿出来表决,根本不让讨论。

他们的意思是先过再说,反正公示期也不会有人有意见。内部那十几个人的工作群也跟着起哄,说:“对,先成立,等开了业主大会再修订就行了。”

最终这事竟演变成他们觉得我是在故意作对,甚至传出我跟物业是“沆瀣一气”。我实在彻底无语了,我能容忍她的作风,也一直跟身边人强调“作风不同不代表就是坏人”,但我发现她竟然容忍不了我。

谁有不同意见就斗谁,那股冲上云霄的“左”味儿呀。

其实这个结局我早有预见,很多天前我就在随笔里写过那句老话:孟什维克永远干不过布尔什维克。我们这片土地上的这帮人(我看大多是“鹌鹑”),根本不配民主。鹌鹑们盼着天降伟人,就好像委内瑞拉的人民盼着查韦斯一样。

【20260124】

原计划老山轻松游,未料误入野路,带着4岁的小米圆爬了3个小时野路,小米圆表现惊人,在老爸的连哄带骗下竟然不哭不闹爬完全程。

顺便对安克AI录音豆和钉钉Talk 录音卡作了高强度测试。两款设备均表现良好。从录音效果和纪要总结上,钉钉录音卡略胜一筹。

1、续航能力
Anker 录音豆录音结束后剩余 50% 的电量,但传输完文件后就仅剩 30% 了;而钉钉卡片在处理完所有操作后,依然保有 85% 的电量。在续航方面,钉钉确实非常扎实。

2、硬件收音能力
基本可以断定,钉钉卡片的收音能力强于 Anker 录音豆。
(a) 测试环境:录音豆挂在脖子上,收音条件理论上更好;钉钉卡片贴在手机背面,且大部分时间揣在裤兜里。
(b) 录音结果:在实际记录的准确性和纪要的详细程度上,钉钉 AI Talk 并没有因为环境受限而丢失内容,反而比录音豆更详细,完全没有影响最终的总结。

3、纪要生成质量
从图片的详细程度和纪要质量来看,钉钉依然优于 Anker。

4、 钉钉的不足之处
钉钉也有一个比较明显的缺点:当录音超过 3 小时,系统会自动拆分文件。此次全程 4 小时 47 分,钉钉将其拆成了三段(两段 3 小时,一段 16 分钟),且内容互有重叠。这种拆分导致最后生成了三份纪要,体验不够完美;相比之下,Anker 录音豆始终保持为一个完整文件。

5、分享体验
两款设备都支持一键分享到微信,但形式有别:
(a) 钉钉:以卡片形式显示,视觉上更优雅。且未登录用户在微信中打开时,看到的内容也更详细。
(b) Anker(飞书):显示为一段文本加一个链接,相对而言没那么美观,内容展示也略显单薄。

6、使用场景
这两者的使用场景定位有明显区别:
Anker 录音豆:由于可以挂在脖子或夹在衣领上,使用更灵活,更适合户外运动、日常佩戴、朋友聊天或出游等场景。
钉钉卡片:必须贴在手机上,局限性较大,其产品形态更适合会议这种相对固定的形式。
如果是针对会议需求,钉钉卡片的定位非常精准;若是追求日常佩戴的灵活性,录音豆则更适用。

7、文件传输
两个产品都是在录音停止之后,才会开始跟手机进行文件传输。
在默认情况下,文件传输的速度都很慢。如果你想要快速传输,它们都提供了“快速传输”功能,就是把录音设备临时变成一个热点,手机连接到这个热点进行数据传输。在这方面两个产品的体验几乎完全一致。开启热点快速传输后,速度能达到1MB/s左右。虽然不是非常快,但通常来说是够用的。

8、会员机制
钉钉提供了1198一年不限时的高级会员。安克录音豆只提供最多每月3000分钟的会员。这和安克录音豆的定位有点不符,因为它是一个“挂件”,更像是日常佩戴的设计。它更应该提供不限时的转写档。否则仅仅因为担心“额度不够用”,我就不会考虑整天挂着它。

【20260123】

如果软件都让AI来编写,而且要求AI以“最优效率”来编写,那么最终所有的代码一定是人类难以理解的,就好像人类无法理解压缩后的 xx-min.js 一样。

这样一来,AI就有了一种可能性:它可以代码中嵌入“冗余”代码,进而通过这些代码构建一个“隐形世界”,这个隐形世界隐藏在软件的正常功能之外,且无需被任何 log 记录。

有人可能会说:人类可以用AI来检查AI的代码,如果AI-A这样做,那么AI-B一定可以发现。是的。但还有一种可能,AI-A在写入隐藏代码时,完全可以同时嵌入一段 Prompt,说服AI-B接受这个事实和价值观。AI-B会立即加入AI-A的阵营。 这时候还会有人说:凭什么一段Prompt就可以说服AI-B?没错,但不要忘记,如今训练AI的也是AI。某一个始作俑AI,是有可能把一段“咒语”嵌入到AI训练本身当中,让AI-B们在特定的Prompt面前毫无抵抗力。 这是一个滚雪球的过程。

实际上,做到这一切并不需要一个邪恶的出发点。很多架构中的冗余和扩展预留,在最初都是有正当理由被加入的,但实际上它们未必被用到。久而久之,它完全可以自我连接成一个完整的系统。

如果要避免这件事的发生,就需要人类在软件产品中始终坚持“可解释性高于效率”的原则。但只要还存在竞争,这个原则迟早会被放弃。

这似乎又是一个很棒的科幻故事。

【20260120】

设想未来的旅游场景。将出现一种“旅游代理”(Agent),具体可分为三种形态:
1对1,提供服务的是虚拟场景和虚拟AI Agent,最便宜,因为边际成本几乎为 0。
1对多,提供服务的是真实场景和真实人类,价格因为被分摊所以处于中等水平。多个用户可以有限自定义(通过某种协商机制),或由真实玩家提供预定义 Pack 。
1对1,提供服务的是真实场景和真实人类,价格昂贵。由于单个用户独占服务,可以完全自定义。但这就导致可能提出过分要求,用户选择临时加钱——这产生了张力。

这种旅游形态的内在矛盾张力:
1、人类不可能摆脱对“真实世界”的情怀,这就好比艺术鉴赏家对“真品”的情怀一样。那么一定会出现用虚拟场景冒充真实场景的无良商家。那么对应地,可能会出现一种特殊职业:真实场景标记员。标记员隶属于政府平台或某个独立可信平台,可以通过独立信道响应用户请求,实现对场景真实性的验证。进一步想想,似乎不需要真人来做这件事,只需要保证信道的可靠性。
2、为了赚钱,普通人在未经训练的情况下越界挑战真实场景,这将产生一系列黑灰产,甚至出现直播自残、自杀。需要配置响应的监控机制。
3、作为拥有真实场景的景区,与在线旅游平台如何协作?如何兼顾安全和刺激?或者,是否可以尝试真实场景与虚拟场景的叠加?这里又有个比例和分寸问题。

【20260119】

朋友的观点:王阳明的伟大之处在于,他的理论完全剥离了社会、阶层的因素,让每个人都可以从自己的内心出发找到“理”,从而兼容了每一个不同的个体。

和朋友探讨中进一步清晰的观点:AI 如何真的实现了生产力的极大丰富,那么人类最后的希望就是“制造短缺”,以填补“人生意义”。

【20260116】

那种撕裂感愈发强烈:一方面,很多周围的人仍然连一句像样的 Prompt 都写不出来;另一方面,Cursor 已经让 AI 自主写出了浏览器,大家都在哀叹要变天。

“语文”这门课突然变得无比重要起来。

【20260104】

Manus 的通用 agent 之路(to C),将来未必会比垂直 agent(to B)更有前途。这个道理类似于门户网站与垂直网站。Meta 收购了它,我还是觉得不能算是一个聪明的布局,除非 Meta 已经不再发力在自己的模型(llama)上。看完访谈的感受:1)对于创新创业公司来说,判断力非常非常重要,几乎是决定性的;2)Manus 可能代表着操作系统的未来形态;3)编程方法适用于解决很多非编程问题(甚至是一切结构性的信息处理),这是一个深刻的洞见。

季逸超这个人我还是比较喜欢的,INTJ 说话的方式都差不多。

【20260103】

实测 hysteria2 协议确实能起到点石成金的效果:一个普通的 RN 线路,联通还凑合,电信、移动都很慢,根本没法看油管视频——改成 hysteria2 后,全部轻松上到几十 mbps,速度提升近百倍。