当AI学会"操作"电脑:我们离自动驾驶又近了几步?
OpenAI Codex电脑控制功能登陆Windows,AI now can "see" and operate your screen
🌊 一项可能改变游戏规则的更新
北京时间昨天深夜,OpenAI正式宣布Codex登陆Windows系统。这不是简单的API接入,而是一个能够真正"看"见屏幕、"理解"界面、并执行操作的AI Agent。
作为一个长期关注AI发展的从业者,我必须说:这次不太一样。
🔧 Codex到底能做什么?
通俗来说,之前的所有AI对话本质上都是"文字游戏"——你打字,它回话。但Codex做的事情相当于:
┌─────────────────────────────────────────┐ │ 用户说:"帮我订一张后天去上海的机票" │ │ │ │ Codex做的: │ │ 1. 截取屏幕 → 分析当前界面 │ │ 2. 点击航空公司App → 进入购票流程 │ │ 3. 输入出发地/目的地/日期 │ │ 4. 选择航班 → 填写乘客信息 │ │ 5. 完成支付 → 输出订票成功截图 │ └─────────────────────────────────────────┘
它不再只是回答问题,而是代替你操作。
⚡ 这项技术意味着什么?
我认为三个层面值得关注:
▸ 第一层:效率跃升
以日常办公为例——如果你每天需要花半小时处理报销、填表、查文件,Codex理论上可以接管这些重复性工作。这意味着知识工作的范式正在被重新定义。
▸ 第二层:门槛下降
非技术用户也能通过自然语言指挥电脑完成复杂操作。这不只是便利性问题,而是数字鸿沟的又一次缩小。
▸ 第三层:信任边界
当AI可以操作你的电脑、访问你的文件、甚至替你下单——你在多大程度上愿意交出控制权?
这个问题没有标准答案。但值得每个人思考。
📍 距离真正的"AI自主"还有多远?
必须泼点冷水:当前的Codex仍然有以下局限:
但正如八年前的GPT-3没人想到今天的大模型能在高考里拿高分,技术的发展往往快于预期。
💬 写在最后
我记得科幻电影《Her》里,AI助手萨曼莎最终学会了"离开"。当时觉得荒诞,如今再看:
当AI不仅能听懂你的话,还能帮你做事——或许我们真正需要适应的,不是AI能做什么,而是我们愿不愿意放手。
你对AI操控电脑怎么看?欢迎在评论区聊聊。


加猪大叔微信(356216540),可免费领取价值千元的【AI 内部学习资料】。想快速上手学习 AI,这份资料绝对有用!(领资料备注:资料)
如果喜欢猪大叔的内容,记得点个「赞」和「在看」或者「转发」给需要的朋友哦~