2026年4到5月,六家企业软件厂商的AI产品,在同一时间窗口被放在了聚光灯下。金蝶灵基、用友YonClaw、SAP Joule升级、浪潮海岳、鼎捷雅典娜、华为MetaERP——发布会一个接一个,PPT一个比一个厚。
但翻完所有材料,我发现一个共同的问题:没有一把统一的尺子。每家的PPT都在讲"智能""自主""AI原生"——但这些词到底是什么意思?你家说的"智能"和他家说的"智能"是一个东西吗?
为什么需要一把尺子
汽车行业有SAE的L0-L5自动驾驶分级标准——全世界都知道L2自适应巡航和L3条件自动驾驶之间的区别。消费者买车的时候不用懂技术,看到L2和L3就大致知道这台车"能自己开到什么程度"。
企业AI需要同样一把尺子。不是为了让厂商对号入座互相攻击,而是让选型的人和行业从业者有一个统一的认知框架——看到"智能""自主"这些词的时候,能立刻判断它对应的是哪一级能力。
下面这个框架,是我基于六家产品研究和五年ERP销售经验做的归纳。它不是官方标准,但可以作为行业讨论的起点。
L0:纯手动——人做一切
你打开ERP,自己看数据、自己查报表、自己做凭证、自己下决策。系统只是一个电子账本——记录你的操作,但不对任何决策负责。
2026年了,中国还有大量企业处于这个状态。不是没上ERP——是上了ERP之后,所有分析、判断、决策还是靠人盯着。屏幕换了一块,工作方式没变。
按个对标:传统ERP软件的基础形态。打开系统,你看到的是菜单和表单,你要自己去找你需要的东西。
L1:定速巡航——你说一次,它做一次
这是大多数企业在接触AI时的第一个姿势。
你打开AI助手,输入"查上个月华东区应收账款"。AI调数据、生成表格、发给你。然后等你下一句。你再说"帮我把超期90天以上的标红"。AI标红,发给你。然后继续等你。
关键特征:每一次交互都需要人主动发起。AI不做预判、不主动发现问题、不跨任务协同。它就像一个刚入职的实习生——很能干,但需要你把每件事都说清楚。一个任务完成之后,它就停在那里等你下一句指令。
目前市面上大多数标榜"AI功能"的企业软件都停在这个层级。帮你写文案的、帮你做PPT的、帮你查数据的、帮你出报表的——技术上这些已经是大模型驱动的真AI了,不是规则引擎。但交互模式上,它们都停在L1:你说一句它做一件,做完就等你下一句。
一个关键区分:L0-L5衡量的是"AI有多大自主权",不是"用了多先进的技术"。L1可以用GPT-4级别的大模型,但自主权为零——每次都要你来下指令。L3可能用的是同一个大模型,但因为加了任务规划、工具调用、多步执行的能力——自主权发生了跃迁。
对标实际产品:2023年9月发布的SAP Joule第一版,虽然背后是完整的生成式AI,但从交互模式上就是一个典型的L1——你问它答,它帮你查数据、写分析、生成文本。直到2026年5月升级后加入了智能体自主执行能力,才从L1跳到了L3。
L2:自适应巡航——它发现问题,你决策
这一级最容易产生误判。很多人觉得"系统自己发现问题了就是AI"——其实不是,传统ERP十几年前就有这个能力。
金蝶星空有个"业务监控平台"——你设定规则:库存低于安全线、订单超期未发货、应收账款超账龄。系统自动监测、自动预警、推送到你面前。用友U8有预警系统。SAP有Workflow。全行业都在做,做了十几年了。
但它的底层逻辑是IF-THEN规则引擎,不是AI。如果库存低于X,推送补货提醒。如果订单超期Y天,标红预警。如果应收账款超过Z天,提醒催收。后面的每一步——"要不要补货""补多少""找哪个供应商""要不要降价清库存"——还是人来做。
L2的价值在于:AI的角色从"被动执行"变成了"主动发现"。但决策权还在人手里。你点头它才动。
鼎捷雅典娜的"事找人"就是这个层级。数据变化了,系统主动推送任务给你。一个供应链场景里物料周转天数从300天降到108天——这两个数字是真的、硬的、值得尊重的。但它的底座是优化算法和规则引擎,不是大模型推理。这是工业工程的胜利,不是AI的胜利。
关键的界限:L2靠规则引擎+BI就能做到——传统ERP十几年前就有业务监控和预警。但L1需要大模型——写分析报告、理解自然语言查询、生成文案,这是LLM才有的能力。两者的技术底座完全不同,但在"自主权"这个维度上,它们都还没到L3——最终拍板和执行的还是人。
这里有一个看似矛盾的地方——L1靠的是大模型,技术比L2先进得多。但L0-L5这个框架衡量的不是"技术先进度",是"AI有多大自主权"。L2虽然底子是老旧的规则引擎,但在"谁来发现问题"这件事上,它比L1多走了一步:从被动执行变成了主动发现。
L3:高速放手——你说目标,它自己干(分水岭)
这是整个框架最关键的一级。L3之前和L3之后,AI的角色发生了根本性变化。
L3的定义:你给出一个目标,AI自己拆解任务→调用系统→执行流程→交付结果。你只做最终审核。
举一个实际场景——财务月底关账。
L2的做法:系统提醒你"应收应付有差异,需要处理"。然后你打开明细、逐条核对、手工调整、做凭证、出报表。AI帮了你一下(提醒),但剩下的事还是你做的。
L3的做法:你对着系统说"把这个月的账关了"。AI自己去抓所有应收应付数据→自动匹配差异→自动标出异常→自动生成对账报告→自动发起调整审批。你只需要审核AI标出来的那几笔异常,点确认。
L3就是分水岭。过了L3,AI从"工具"变成了"同事"。没过L3,AI永远是助手——帮你查、帮你算、帮你提醒,但动手的还是你。
L3需要什么技术能力?它需要大模型的推理能力——理解你的目标、拆解成子任务、判断调用哪个系统模块、处理执行中的异常、生成结果。这不是规则引擎能做的,必须靠生成式AI+智能体协同。
对标实际产品:
● 金蝶灵基的Work模式——你定义目标,AI智能体承接任务、调用系统、协同流程、交付结果。2026年5月20号发布,5月28号上架,架构到了L3但验证为零。
● 用友YonClaw的超级智能体——覆盖全场景,你说目标它执行。4月28号发布,同样架构到了但验证为零。
● SAP Joule 2026版——2023年初版是L1,2026年5月Sapphire大会升级后,自主关账助手已经是标准L3了。从L1到L3,SAP花了三年。
L4:几乎无人驾驶——它自己跑,你偶尔看
L4是真正意义上的企业级AI自主——跨部门、跨流程的端到端自主决策和执行。
设想一个场景:一个销售订单进来→AI自动排产→AI自动触发采购→AI自动调库存→AI自动安排发货→AI自动对账收款。从订单到现金的全链路,没有一张表单是人填的,没有一次审批是人发起的。
人只做一件事:设边界。比如"单笔超过500万的订单需要我确认""更换供应商需要我审批""毛利率低于10%的订单自动拦截"——除此之外,AI自己跑。
目前没有任何一家厂商在L4上有验证数据。有概念设计、有架构规划——但没有客户实际跑出来的案例。L4是目前行业的天花板。
L5:没方向盘——科幻
L5的终极形态:没有ERP操作界面了。
你每天早上打开手机,收到一份日报:"昨天AI处理了473笔订单、自动排产了12个工单、核销了86笔应收账款。发现3个异常——已自动解决。其中第2个异常——华东区一笔500万订单毛利率低于15%,AI建议下周跟客户谈提价,理由如下……"
人对企业的管理,从一个"操作系统"变成一份"每日简报"。你定战略,AI管执行。你问问题,AI给答案。
这是科幻。目前只存在于发布会那句"全面自主企业"的口号里。但L5的存在是有意义的——它告诉你这条路最终指向哪里。
用一个表格说清楚
注意这个框架的关键张力:L1用大模型(技术先进)但自主权最低,L2靠规则引擎(技术老旧)但自主权反而高一步。L0-L5衡量的是"AI能自己做多少事",不是"用了多先进的技术"。到了L3,技术和自主权终于合在一起——大模型+智能体协同,才真正实现了"你说目标它自己干"。这是质变。
六家厂商当前对标(2026年5月)
用这个框架量一下目前六家主流企业软件厂商的AI产品——基于公开发布会、官网、白皮书信息。
金蝶灵基(2026.5.20发布):架构L3。Work模式"你说目标它自己跑"。Chat上手、Work执行、Build开发三层入口。5月28号正式上架,客户验证数据为零。
用友YonClaw(2026.4.28发布):架构L3。超级智能体设计覆盖全场景。同样刚发布,验证为零。
SAP Joule(2023首发,2026.5大升级):真L3。2023版是L1助手,2026版升级为Autonomous Enterprise自主企业战略——50+助手编排200+智能体。有几十万S/4HANA客户底座,但从L1升级到L3的过程中存在旧架构兼容成本。
华为MetaERP(2019年被逼自研,2023年内部上线):内部L3。盘古大模型5.5+天筹求解器+Flink流计算驱动。华为内部20万人的财务流程跑通了,但外部客户零验证。ERP行业Know-how的积累不能靠算法压缩。
浪潮海岳(2026.4完整发布):声称L3。商业AI 2.0+工业AI 1.0+企业级智能体平台——体系设计在纸面上到了L3。但4月才完整发布,不到两个月,一个客户验证数据都没有。"声称L3"和"真L3"之间,隔着至少两年的真实客户验证。
鼎捷雅典娜(2015启动,2025架构升级):自动化强,AI刚起步。需要严格拆分——2015-2024年的核心能力是工业自动化(规则引擎+优化算法),300天降到108天的数据是工业工程的胜利。真正的AI尝试是2025年架构升级加入生成式AI引擎才开始的,不到一年。
一个残酷的事实:六家里,真正有L3验证数据的——一家都没有。SAP最接近(有客户基数可以推送升级),华为内部有但外部为零。剩下的全在"有架构、没验证"阶段。
但这不是坏事——恰恰说明整个行业都在L3的起跑线上。谁先拿出真实的L3客户验证数据,谁就领先半个身位。这场比赛,2026年5月刚刚打响。
为什么L3是分水岭?
因为它决定了你卖的是什么。
没过L3的厂商,卖的是"功能"。我有报表功能、我有审批功能、我有预警功能、我有AI聊天功能。客户买的是功能的集合。功能的定价逻辑是按模块算——财务模块多少钱、供应链模块多少钱。
过了L3的厂商,开始卖"结果"。我不跟你讲我有多少功能——我跟你讲我帮你省了多少时间、降了多少成本、减少了多少错误。客户买的是结果。结果的定价逻辑是按价值算——帮你省了一个财务主管的人力成本,我收你三分之一,不过分吧?
功能的价值是线性的——多一个模块多一份钱。结果的价值是跳跃的——一旦过了L3,你的产品从"工具"变成了"劳动力"。商业价值差一个数量级。
这就是为什么每家企业都在喊L3。不是因为它听起来高级——是因为过了L3,商业模式变了。
但喊和做之间,隔着真实客户数据的鸿沟。
写在最后
这个框架不是定论,是一个开放讨论的起点。六家对标是基于2026年5月公开信息做的判断——企业AI发展太快,金蝶灵基5月28号上架、SAP刚完成升级、浪潮的客户案例可能在秋季出来。今天标的位置,半年后可能完全不同。
建议你把这篇收藏。2026年底的时候回来对照——看看谁从"声称L3"变成了"真L3",谁还在L1-L2修修补补,谁默默跳到了L4。
我是子路,评论区聊聊——你的企业和你的ERP,目前在L几?