打破框架,解放思维:未来AI的样子
最近,我看到Cursor的设计师分享了一段观点,真的是让我心里一凉,但又觉得特别有道理。
他说:“其实我们每天用的那个‘文本输入框’,反而限制了我们更好地利用AI。”
乍一听,这话有点让人摸不着头脑。毕竟,自从ChatGPT出现以来,大家都在告诉我们:“自然语言是新的编程语言”,指示词工程(Prompt Engineering)变得相当重要,我们必须学会如何“与机器对话”。
不过,回想一下你最近一次被AI惊艳或气到的时刻,或许你会发现他的观点确实很有道理。
那闪烁的光标,实际上并不是我们和AI之间的桥梁,反而像是思维的枷锁。
为什么说“打字”是在给智商降维?
我们得承认一个真相:人类的思维绝对不是线性的。
当你构思一个架构、写篇文章,或者解决复杂的Bug时,你脑子里面闪现的是什么呢?
肯定不是一行行整齐的代码或文字,而是一个杂乱无章却充满联想的“场”。这里有模糊的直觉,那里有回忆,甚至还有你此时的情绪和屏幕上的画面。
这就像是一个三维,甚至更高维的“思维宇宙”。
但是,要让AI理解这些,你就得做一件事情:有损压缩。

你不得不把这个立体的思维空间硬生生地压扁,把那些难以用言语表达的直觉翻译成一行行死板的文字指令。
这感觉就像你试图把一只大象通过一个狭窄的钥匙孔塞进房间。
在这个过程中,很多信息都被丢失了,你的灵感也被打断。最累的并不是思考本身,而是“如何将思考传达给AI”。这真的是反人性的。
如果AI不再“对话”,它会是什么样子?
如果现在的ChatGPT模式是让我们被框架限制思考(Thinking inside the box),那么未来的AI肯定要打破这个框架。
未来的互动形式,可能不会再是你问我答的聊天机器人,而更像以下几种方式:
1. 看我怎么做,不用说话
Cursor已经部分实现了这一点。你写代码的时候,AI就像一个幽灵副驾驶,静静地观察你的光标、你修改过的文件和停留的页面。
当你准备输入下一行代码时,它已经提前给你准备好了建议,只需按一下Tab键即可。
最理想的交互方式,就是零交互。将“我命令你做什么”转变为“你猜我想做什么”。
2. 不打字,用“画布”交流
为什么我们的聊天记录非得是左右两列?
我们的思维是网状的,所以交互界面也应该是网状的。未来的AI界面应该是一个无限大的白板(Canvas)。
你可以像玩积木一样,把代码块、文档和参考图像随意放上去。只需把它们摆放在一起,画条线,AI就能明白:“哦,你想把这三个整合起来。”
这才符合人类的直觉和“空间记忆”。
3. 指哪打哪
现在的多模态技术还在探索阶段。未来理想的状态是:我戴着眼镜或者盯着屏幕,手指圈住某个区域,嘴里随便说一句“这块太丑了,换个风格”。
AI能够同时理解我的视觉指向、语音指令和上下文环境。
我不需要截图、发给AI,再写一段几百字的说明。高效的输入,才能带来高效的输出。
人机交互的发展历程,其实就是一部让机器适应人类的历史。
最早,我们得迁就机器,使用穿孔纸带;后来我们学会了DOS命令;再后来有了鼠标和图形界面,机器逐渐理解我们的直觉;但如今,我们却被“文本框”这个瓶颈束缚住了。
Cursor设计师的话,其实是在给“提示时代”下了判决。
也许再过两三年,当我们回首时,会发现“写得一手好提示”就像当年“能背下所有DOS命令”一样,成为一个过渡时期的技能,终究会被淘汰。
未来的AI,不应该是一个等待你输入的“对话框”,而是一个能够理解你心意、无处不在的“环境”。
既然AI越来越像人类,它就应该学会像人一样去感知,而不是让人类像机器一样去表达。
