从机关盒到 Vision Pro,我其实一直在解同一种谜题
有时候我自己回头看,也会觉得我的内容路线挺神经的。
前面还在对着机关盒骂骂咧咧,下一期突然开始聊 ChatGPT。 刚拍完掌上密室,转头又去折腾 Quest 3。 再往后甚至开始搞一些“穷人版 Vision Pro”式的小玩意儿,像是强行从解密区拐进了科幻区。
如果只看标签,这几件事确实不太像一类。 一个是木头金属卡扣弹簧磁铁。 一个是大模型、生成式 AI。 一个是 XR、手势、眼动、空间计算。 表面上风马牛不相及。
但如果你问我自己怎么看,我其实会觉得: 我根本没有换赛道。
我只是把解谜的对象换了。 以前我解的是一个盒子,现在我解的是一种交互。 以前我好奇的是,“这玩意儿到底哪能按、哪能转、哪能推、哪一步是在骗我”。 现在我好奇的是,“这个系统到底把真正的入口藏在哪了,它对人的行为预设是什么,它改变的到底是哪一个习惯动作”。
本质上,一样。
我一直都特别迷恋那些“表面规则看起来很正常,但你总觉得它还有第二层”的东西。 Puzzle 最直接,它就是明着告诉你:我有秘密,你自己想办法。
而很多新技术其实也是这样。 只不过它们不叫自己 Puzzle,它们叫产品、叫平台、叫下一代设备。 但你一旦真的上手去碰,就会发现它们和 Puzzle 的气质特别像: 它们都有一层你第一眼看不到的规则。
就拿 Vision Pro、Quest 3 这种东西来说吧。 很多人第一次看,关注的是参数、价格、清晰度、生态。 这些当然重要。 但我自己最先关注的永远是另一件事: 它到底改变了哪个“默认动作”?
人和设备之间最底层的关系,其实一直是交互。 鼠标键盘是一套规矩,触屏是一套规矩,手柄是一套规矩。 你一旦熟了,就会把那套规矩当空气。 但新设备真正有意思的时候,往往就是它开始让你意识到: 哦,原来这套“空气”其实是能换的。
为什么我会去折腾那些看起来很“Vision Poor”的小改件? 因为我一直觉得,真正有趣的不是“买到了未来”,而是摸到了未来是怎么工作的。
一个现成的高端设备当然很酷。 但对我来说,自己拿着便宜方案去试错、去逼近、去理解那个交互逻辑,反而更上头。 那种感觉和开一个高难机关盒特别像: 你不是单纯想把它用起来,你是想知道它为什么能这样。
同样的事也发生在 AI 上。
我之前做过那期关于 ChatGPT-4 的内容,后来还写过一篇专栏。 当时有不少人吵来吵去,有人觉得夸张,有人觉得危言耸听,有人觉得“你这不就是标题党”。 这些反应我都理解。
因为 AI 这件事最容易让人误会的地方就在于: 大家总把它理解成一个“更强的工具”,但我更愿意把它看成一个行为系统。
它当然会写、会答、会生成。 但这都只是表面。 真正让我感兴趣的是: 当你给它一个环境、一套目标、一些规则之后,它表现出来的那种“像真的一样”的东西,到底意味着什么?
我不是说它真的活了。 但我一直觉得,很多讨论都卡在“它是不是人”这个问题上,卡得有点太早了。 对我来说,更值得琢磨的是: 如果一个系统在结果层面已经越来越像“会自己行动的东西”,那我们到底该怎么重新理解“智能”“意图”“协作”这些词?
这个问题很像 Puzzle。 不是因为它有标准答案,而是因为它会逼你去拆自己原来默认的理解方式。
所以别人看我的内容,可能会觉得“你怎么一会儿机关盒一会儿 AI 一会儿 XR”。 但如果从我自己的脑子里往外看,其实它们一直是一条线。
这条线的名字大概可以叫: 我想知道规则到底藏在哪。
机关盒把规则藏在结构里。 密室把规则藏在叙事里。 AI 把规则藏在概率和语料里。 XR 把规则藏在手势、视线和空间里。
它们都不直接把门放在你眼前。 你得去摸,去试,去撞,去错,然后一点一点把门找出来。 而这种过程,我到现在还是觉得特别迷人。
如果真要说“转型”,那也许只是谜题从桌面走进了屏幕,又从屏幕走进了空间。 但我脑子里一直追的,还是同一个东西: 一个系统到底是怎么把自己的秘密藏起来的。