我搭了一套"硅基员工"体系——17个AI技能,覆盖信息获取、视频学习、主题调研、公众号写作。听起来很酷对吧?
但实际用起来,我发现自己被AI绑架了。
给AI布置了一个任务,它干到一半停下来问你:"请问这个文件应该放在哪个目录?"你回答完,它又干了两步,又停:"这里有两种方案,你选A还是B?"一个本来AI自己就能搞定的活儿,硬是被切成了二十段,每一段都要你亲手接一下。
看起来AI在帮我干活,其实是我守在电脑面前,不知道它啥时候又蹦出来要我点确认,撒泡尿都不敢走远了。
看起来效率提高了,实际上被AI禁锢在了电脑前面,时间被无限碎片化。
你以为你在用AI,其实你在当AI的人肉中间件。
这就是我过去两个月最大的痛点。
一、痛点:你不是在用AI,你是在伺候AI
AI不敢做决定。
每次遇到需要判断的地方,它就停下来等我。搜索策略选哪个?等我。文件命名用什么风格?等我。输出格式要不要调一下?等我。
更要命的是另一个极端:偶尔它又太敢做决定了。一个生产环境的配置文件,它没打招呼就给改了。一条飞书消息,它没经我同意就发出去了。
该问的不问,不该问的不说。
这两个问题叠在一起,导致一个结果——我没办法离开电脑。AI干活的时候我得全程盯着,随时准备接它抛过来的问题,随时准备拦住它的越权操作。
说好的"AI替我干活"呢?怎么变成了"我陪AI干活"?
问题不在AI不够聪明,在于我没给它一套清晰的决策规则。
二、解法:给AI装一套"自动驾驶系统"
汽车的自动驾驶分L1到L5,我给AI Agent的自动驾驶也分了层级。核心就做了三件事:
第一件:红黄绿灯——把AI的决策权限说清楚
这是整个体系的基石。我在AI的"工作手册"里写了一个决策权限矩阵:
| | |
|---|
| | 涉及生产环境、给别人发消息、花钱超$5、修改AI核心配置 |
| | |
| | |
一目了然。AI拿到任务之后,每走一步先对照红黄绿灯,不用再猜"这个我该不该问老板"。
关键不是"分了三类"这件事本身——关键是把AI的决策边界从模糊变成了显式的。以前AI只知道"完成任务",不知道"哪些决定我可以自己做"。现在它知道了。
第二件:异步沟通——让AI在我不在的时候继续干活
以前的模式是:AI遇到红灯就停住,等我回来才能继续。这意味着我出去吃个饭,AI就在那干等着。
现在的模式是:AI遇到红灯,把决策问题写到一个共享文档里,然后跳过这个步骤,继续推进其他能独立完成的部分。
我打开手机,看到文档里有两个待决策项,花30秒回复完。AI读到我的回复,把跳过的部分补上。
整个过程里,AI不需要等我。我也不需要守在电脑前。
这就是"异步沟通机制"——把人和AI的时间解耦。AI的工作流不再被我的在线状态阻塞。
第三件:标准工作流——Research到Verify四步走
光有决策规则还不够,AI还需要知道做任何任务的标准姿势。我给它定了一个四步流程:
1. Research——先搞清楚影响范围、依赖关系、有没有现成方案
2. Plan——先设计怎么验证,再设计怎么实现,列出具体步骤和回滚路径
3. Implement——最小改动,不顺手重构,复用现有的东西
4. Verify——跑检查,报告实际结果,不说"应该没问题"
这四步不是建议,是强制流程。AI不能跳过Research直接开干,不能跳过Verify就说完成了。
为什么要这么死板?因为AI最容易犯的错不是"做不对",而是"没想清楚就开始做"。强制它先Research再Plan,相当于给它装了一个"三思而后行"的硬约束。
三、实际效果:从"陪AI干活"到"验收AI成果"
上周我出门吃饭前,给AI布置了一个任务:调研一个新主题,整理成结构化报告。
以前这种任务我得全程在线,AI搜到一半会问我"要不要换个搜索策略",整理报告时会问我"这个段落要不要展开"。
现在呢?我吃完饭回来,打开电脑:
- 文档里有1个待决策项(它在搜索时发现了一个付费信息源,问我要不要花3美元购买——这是红灯,正确)
我回复了一个"买",AI读到后继续补完剩余20%。整个任务从"需要我全程陪3小时"变成了"我花2分钟验收"。
四、怎么做:给你的AI装上自动驾驶的实操步骤
不管你用的是Claude Code、Cursor还是其他AI工具,核心逻辑都一样。以下是可以直接照做的参考步骤:
Step 1:写一份AI工作手册(30分钟)
创建一个配置文件(Claude Code里叫CLAUDE.md,Cursor里叫.cursorrules),写清楚三件事:
1)AI的身份和工作方式
告诉AI它是谁、做事的标准流程是什么:
- 所有任务按 Research - Plan - Implement - Verify 流程执行
- 遇到需要判断的地方选择最合理的方案继续,不要频繁停下来问
2)红黄绿灯决策矩阵
把你日常工作里AI会遇到的所有决策场景,分成红黄绿三类。刚开始不用太细,先把最明显的列出来:
- 红灯:删文件、发消息给别人、花钱、改生产配置——必须等你确认
- 绿灯
- 其他先放黄灯
3)高风险红线
哪些文件绝对不能碰,哪些操作绝对不能执行。这是底线,写得越具体越好。
Step 2:建立异步沟通机制(20分钟)
核心是让AI遇到红灯时不要停,而是:
- 把决策问题记到一个你能随时用手机看的地方(飞书文档、Notion、本地文件都行)
具体用什么工具不重要,重要的是这个"记录-跳过-续做"的三步机制。
Step 3:迭代你的红黄绿灯(持续进行)
这是最重要的一步,也是永远不会停的一步。
用起来之后你会发现:
- "这个AI每次都问我,但我每次都说OK" → 从红灯降级为绿灯
每次踩坑后更新你的决策矩阵。 这不是写完就扔的文档,是一个活的系统。
社区里的最佳实践也是这个思路:"每当AI犯错,不只修复当前问题,还把规则加入配置文件。"让同样的错误只发生一次。
Step 4:从60分开始,让AI自己进化到90分
完美主义是自动驾驶最大的敌人。
60分的产出迭代到90分,比0分等到100分强十倍。先让AI跑起来,然后——关键来了——不是你去手动帮它变好,而是建一套机制让它自己变好。
从60分到70分:让AI学会反思
AI干完一个活,产出物是60分。这很正常,别慌。
你要做的不是替它改到80分,而是告诉它哪里不好、为什么不好。然后确保它把这些教训记下来,而不只是当场改完就忘。
我给AI搭了一个"知识蒸馏"机制:每次任务结束后,AI会自动复盘这次的经验——踩了什么坑、哪里做得好、哪些步骤可以复用——然后把这些提炼成结构化的知识条目,存进一个持久化的知识库。
这就像一个新员工每天写工作日志,但比人靠谱——它真的会在下次任务前翻阅自己之前的记录。
下次遇到类似任务,AI会先查知识库里有没有前车之鉴。同样的坑不踩第二次,60分就稳定变成了70分。
从70分到80分:让数据驱动进化
光靠反思还不够。反思是定性的,容易有盲区。
我又给AI装了一个"技能进化引擎"——用数据来追踪它每个技能维度的表现。
举个例子:我让AI每天帮我搜集行业资讯。它一开始推的信息60%是有价值的,40%是噪音。
技能进化引擎会追踪四个维度:
每周它会自动做一次"自检"——分析过去7天的数据,淘汰低产的搜索词,强化高产的信息源,收紧不精准的筛选维度。
这不是我教它的,是数据告诉它的。从凭感觉干活变成了用数据迭代,70分就稳步爬到了80分。
从80分到90分:反馈飞轮
前两步解决了"AI能从错误中学习"和"AI能用数据自我优化"。但还有一个关键拼图:你的反馈。
90分的关键不是AI更聪明了,而是你和AI之间形成了一个飞轮:
AI产出 → 你标注反馈(好/不好/哪里差) → 反馈写入进化数据 → AI调整技能参数 → 下次产出更好 → 你标注反馈 → ……
这个飞轮的精妙之处在于,你的"管理动作"极其轻量——不需要你教它怎么改,只需要你说"这个好"或者"这个不行"。
AI把你认可的产出存为"金标范例",把你的批评提炼为"校准规则"。范例越攒越多,规则越来越细,AI的品味就越来越接近你的品味。
这就像带新人:一开始你得逐字改他的方案,后来你只需要说"这个方向不对"他就知道怎么调了,再后来他交出来的东西你扫一眼就能过。
到这一步,AI真正变成了一个"越用越好用"的系统——不是因为模型升级了,而是它在你的反馈中长出了属于你的判断力。
五、本质:你不是在学AI,你是在学管理
做了这么多年业务和管理,我发现一个有趣的事:
和人打交道的逻辑,和AI打交道的逻辑,其实是一模一样的。
一个新来的下属,你会手把手告诉他每一步怎么做吗?你不会。你会给他培训技能,给他明确授权,让他自己定义阶段目标——然后在实践中成长。
你越是事无巨细地替他做决定,他越长不大。你越是放手让他在边界内自主行动,他越成长得快。
AI也是一样。
不要替它做每一个决定,而是训练它的技能(标准工作流)、为它授权(红黄绿灯矩阵)、让它定义自己的执行路径——然后在一次次任务中学习、进化、变得越来越靠谱。
管理的终局,是培养出一个不需要你盯着就能交付的优秀员工。
只不过在这个时代,这个优秀员工,是一个AI。
而当你真正学会了管理AI——给它制度、给它空间、给它成长的机会——你就赢得了一种珍贵的权利:
Earn the right to be lazy.