Apr 4, 2026

从机关盒到 Vision Pro，我其实一直在解同一种谜题

有时候我自己回头看，也会觉得我的内容路线挺神经的。

前面还在对着机关盒骂骂咧咧，下一期突然开始聊 ChatGPT。刚拍完掌上密室，转头又去折腾 Quest 3。再往后甚至开始搞一些“穷人版 Vision Pro”式的小玩意儿，像是强行从解密区拐进了科幻区。

如果只看标签，这几件事确实不太像一类。一个是木头金属卡扣弹簧磁铁。一个是大模型、生成式 AI。一个是 XR、手势、眼动、空间计算。表面上风马牛不相及。

但如果你问我自己怎么看，我其实会觉得：我根本没有换赛道。

我只是把解谜的对象换了。以前我解的是一个盒子，现在我解的是一种交互。以前我好奇的是，“这玩意儿到底哪能按、哪能转、哪能推、哪一步是在骗我”。现在我好奇的是，“这个系统到底把真正的入口藏在哪了，它对人的行为预设是什么，它改变的到底是哪一个习惯动作”。

本质上，一样。

我一直都特别迷恋那些“表面规则看起来很正常，但你总觉得它还有第二层”的东西。 Puzzle 最直接，它就是明着告诉你：我有秘密，你自己想办法。

而很多新技术其实也是这样。只不过它们不叫自己 Puzzle，它们叫产品、叫平台、叫下一代设备。但你一旦真的上手去碰，就会发现它们和 Puzzle 的气质特别像：它们都有一层你第一眼看不到的规则。

就拿 Vision Pro、Quest 3 这种东西来说吧。很多人第一次看，关注的是参数、价格、清晰度、生态。这些当然重要。但我自己最先关注的永远是另一件事：它到底改变了哪个“默认动作”？

人和设备之间最底层的关系，其实一直是交互。鼠标键盘是一套规矩，触屏是一套规矩，手柄是一套规矩。你一旦熟了，就会把那套规矩当空气。但新设备真正有意思的时候，往往就是它开始让你意识到：哦，原来这套“空气”其实是能换的。

为什么我会去折腾那些看起来很“Vision Poor”的小改件？因为我一直觉得，真正有趣的不是“买到了未来”，而是摸到了未来是怎么工作的。

一个现成的高端设备当然很酷。但对我来说，自己拿着便宜方案去试错、去逼近、去理解那个交互逻辑，反而更上头。那种感觉和开一个高难机关盒特别像：你不是单纯想把它用起来，你是想知道它为什么能这样。

同样的事也发生在 AI 上。

我之前做过那期关于 ChatGPT-4 的内容，后来还写过一篇专栏。当时有不少人吵来吵去，有人觉得夸张，有人觉得危言耸听，有人觉得“你这不就是标题党”。这些反应我都理解。

因为 AI 这件事最容易让人误会的地方就在于：大家总把它理解成一个“更强的工具”，但我更愿意把它看成一个行为系统。

它当然会写、会答、会生成。但这都只是表面。真正让我感兴趣的是：当你给它一个环境、一套目标、一些规则之后，它表现出来的那种“像真的一样”的东西，到底意味着什么？

我不是说它真的活了。但我一直觉得，很多讨论都卡在“它是不是人”这个问题上，卡得有点太早了。对我来说，更值得琢磨的是：如果一个系统在结果层面已经越来越像“会自己行动的东西”，那我们到底该怎么重新理解“智能”“意图”“协作”这些词？

这个问题很像 Puzzle。不是因为它有标准答案，而是因为它会逼你去拆自己原来默认的理解方式。

所以别人看我的内容，可能会觉得“你怎么一会儿机关盒一会儿 AI 一会儿 XR”。但如果从我自己的脑子里往外看，其实它们一直是一条线。

这条线的名字大概可以叫：我想知道规则到底藏在哪。

机关盒把规则藏在结构里。密室把规则藏在叙事里。 AI 把规则藏在概率和语料里。 XR 把规则藏在手势、视线和空间里。

它们都不直接把门放在你眼前。你得去摸，去试，去撞，去错，然后一点一点把门找出来。而这种过程，我到现在还是觉得特别迷人。

如果真要说“转型”，那也许只是谜题从桌面走进了屏幕，又从屏幕走进了空间。但我脑子里一直追的，还是同一个东西：一个系统到底是怎么把自己的秘密藏起来的。