由于先进工艺节点面临的物理、经济及工程层面的多重障碍,维持摩尔定律所描述的发展轨迹正变得日益困难。当今的集成电路已成为互联系统的核心,从边缘设备到数据中心均依赖其运行,这进一步扩大了设计空间的规模与复杂性。规模与复杂度的爆炸式增长促使产业界不仅将 AI 视为设计目标,同时也将其作为设计流程的基础性使能技术。
对增强性能、效率和新功能的需求继续将IC设计推向极限。拥有数十亿晶体管的现代芯片的规模以及对快速设计周期的需求使得传统工作流程显得不足。从历史上看,EDA和系统设计的进步依赖于三个扩展原则。
• 加速计算(Accelerated Computing):利用多核 CPU、GPU 以及云计算集群来处理大规模计算负载。
• 算法创新(Algorithmic Innovations):先进算法(如动态规划与分治算法)在解决 SoC 组装中的 NP 完全问题方面仍然至关重要。
• 抽象化(Abstraction):从寄存器传输级(RTL)到高级编程语言的更高层次抽象,使设计人员能够管理更大规模的系统模块,并显著提升设计效率与生产力。
AI 时代提供了一套新的工具体系,用以应对这种复杂性,并正在改变人类专家与自动化设计流程之间的交互方式,构建能够进行推理、学习并自主执行复杂工程任务的协同系统。
本文从技术角度探讨 Agentic AI 在集成电路领域中的应用。我们提出一个结构化框架,将 AI 在 IC 设计中的角色划分为五个具有递增自主性的层级,并通过真实案例展示各层级能力。同时,本文讨论关键挑战,并对通向完全自主设计的发展方向进行了前瞻性分析。
面向 IC 设计的 Agentic AI 五级体系
IC 设计中的 Agentic AI 可被组织为类似自动驾驶等级的L1到L5的分阶段演进结构。每个等级不仅由自主程度定义,还取决于模型的技术复杂度、与设计环境的集成深度,以及对 EDA 工作流程的影响。基于算法、语言模型及多智能体编排的发展,这些等级构成了一条可落地的 AI 赋能 IC 设计路线图。
Level 1:优化型 AI(Optimization AI)
优化型 AI 利用先进机器学习(ML)技术解决传统 EDA 工作流程中定义明确的问题,大幅提升或加速过去依赖高计算量数值算法或人工调参的任务。通过结合强化学习(RL)与监督学习模型,该类 AI 通过系统性探索大规模参数空间,以提升关键指标,包括性能、功耗、面积(PPA)以及资源利用率。
强化学习代理与布局布线(P&R)、综合以及仿真等 EDA 工具进行动态交互。这些代理利用历史设计迭代数据训练奖励函数或代价函数,从而能够做出优化设计结果的决策。常用技术包括:
贝叶斯优化
多目标 Pareto 搜索
基于策略梯度的强化学习
用于探索芯片设计中复杂的权衡关系。
例如,基于 RL 的方法已能够自动完成 floorplanning 与资源平衡任务,使功耗降低最高约 15%,并实现高达 10–20 倍的验证回归加速。
近期机器学习研究表明,优化型 AI 具有更广阔潜力。通过算子学习(operator learning)框架与物理信息神经网络(PINN),ML 模型能够加速三维集成电路(3D-IC)设计中关键的热仿真与优化算法。
这些模型以神经算子替代传统数值方法(如有限差分或有限元求解器),直接从设计配置预测温度场。这种方法:
无需昂贵仿真数据
支持复杂热分布的实时分析
在优化流程中实现超过 70× 的加速
此外,将 ML 预测与迭代求解方法(如 GMRES)结合的混合框架,可同时保证效率与可信度,从而弥补纯 ML 方法的精度不足。
优化型 AI 正在重新定义传统 EDA,使设计流程更加快速、高效与可靠,以满足现代半导体开发不断增长的需求。
工业实例
- 使用 RL 优化数字实现流程,实现 floorplanning、资源平衡与工艺 recipe 自动选择(如 Cadence Cerebrus® Studio)。
- 利用 ML 剪枝验证回归集合,大幅减少覆盖率收敛所需仿真次数(如 Cadence Verisium™ AI-Driven Verification Platform)。
- 基于 AI 的模拟版图生成,通过学习历史 tapeout 经验完成器件布线与约束驱动布局(如 Cadence Virtuoso® Studio)。
- 基于 RL 的多学科分析优化(MDAO),提升封装与 PCB 的回波损耗与串扰隔离性能(如 Cadence Optimality™ Intelligent System Explorer)。
Level 2:对话式 LLM(Conversational LLM)
在该层级,AI 系统作为基于语言的接口连接静态知识库,改变设计人员获取与使用复杂知识的方式。通过将检索增强生成(RAG)与大语言模型结合,系统支持对工具文档、应用说明、企业 Wiki 及项目资源进行自然语言查询。
该方法通过对知识库进行语义分块并存储于向量数据库中,提高检索效率。当用户提出问题时,系统仅检索最相关内容,使 LLM 专注处理关键上下文信息。例如,设计人员可以获得来自工具文档的精确、上下文相关指导。
推理模型的发展进一步扩展了能力,使系统能够完成代码生成与调试任务。例如:
“生成一个 Tcl 脚本,为所有高扇出网络插入 buffer。”
系统即可生成语法正确且定制化的脚本。
这种能力来源于针对 Tcl 或 Cadence SKILL® 等专有语言微调的 LLM。企业专有知识亦可纳入向量数据库,使系统适配特定工作流程,从而持续提升系统能力。
工业实例
设计人员询问:
“如何在 Innovus 中创建灵活的 H-tree 时钟结构?”
LLM 返回对应代码片段、解释及步骤说明。
Level 3:复杂推理(Complex Reasoning)
复杂推理阶段实现从静态知识检索向动态工具驱动协同设计与调试的转变。该层级引入上下文感知能力,并通过 API 与实时 EDA 数据进行迭代交互。
AI 系统通过闭环推理:
代理通过 Tcl(数字设计)或 SKILL API(模拟设计)与工具交互。例如:
在模拟设计中,SKILL 代理可根据仿真反馈调整器件布局与布线。
Level 3 的核心特征是迭代优化过程。代理基于上下文推理不断调整策略,例如在调试高扇出网络时分析历史尝试并提出新方案,从而逐步收敛到最优解。
推理模型在其中发挥关键作用:它们能够自动生成工具脚本、验证语法与功能,并依据反馈持续改进。例如自动生成动态功耗优化 Tcl 脚本并反复迭代。
这显著减少人工干预,使工程师能够专注更高层级设计问题。
工业实例
- 形式验证:自动生成 SVA、运行证明引擎、分析失败并建议修正。
- 布局布线:从 P&R 报告定位问题路径,推荐 ECO,自动循环检查时序与泄漏影响。
- 模拟设计:更新迁移测试平台、识别寄生与布局问题并提出修改建议。
Level 4:Agent 工作流(Agentic Workflows)
Level 4 从单任务自动化扩展至多智能体、多领域协同工作流。AI 系统通过互联代理协同完成跨设计阶段任务,实现多工具、多厂商环境中的无缝流程。
该阶段依赖:
以支持上下文与状态共享。
系统引入“流程规划代理(flow planner)”,将高层目标分解为子任务并分配给专用代理。各代理在自身领域独立运行,同时保持全局一致性,这对 SoC 与混合信号设计尤为关键。
例如模拟迁移流程:
代理之间持续交换数据与反馈,实现逐步优化。
工业实例
- 自动解析晶圆厂文档完成 PDK 集成,将 8–10 周流程缩短至约 1 周。
Level 5:完全 Agentic AI(Fully Agentic AI)
Level 5 是 AI 驱动设计自动化的最高阶段。顶层“硅代理(silicon agent)”统一管理数百个子代理,覆盖完整设计生命周期:
硅代理作为中央调度者,动态分配任务并维持全局设计状态,需要强大的状态管理与依赖协调能力。
关键使能技术包括:
数据湖集中存储设计数据与历史经验;错误恢复机制能够定位问题根因并自动修复或向工程师提供建议。
系统同时强调:
每个代理记录决策依据,使设计人员能够理解与验证 AI 行为。
该层级的组织结构类似人类设计团队,通过分层协作解决最复杂的设计问题。
工业实例
- SoC 原型设计:自动解析市场需求,生成架构、RTL、驱动与测试平台。
- 衍生芯片生成:从单一规格自动生成多个 SoC SKU。
- 系统级协同设计:跨芯片、封装与电路板进行实时联合优化。
所提出的五阶段方法以当前及新兴的工具基础设施为基础,为逐步提升 AI 融合程度并最终迈向自主设计提供了一条切实可行的路径,同时在过程中保留验证、可解释性以及人工监督等关键检查机制。每一个阶段都建立在前一阶段之上,引入更为复杂和先进的能力,将传统的 EDA 工作流程逐步转变为智能化、互联化的系统。与任何自动化技术一样,Agentic AI 的成功应用需要充分的理解与审慎对待。对于尚未熟悉 AI 的设计团队而言,从早期阶段(如优化型 AI 和对话式大语言模型)开始尝试,往往是更合适的方式,从而为迈向更高级阶段逐步建立信心。
这一发展历程类似于自动驾驶汽车的演进过程。自动化能力的渐进式提升不断积累信任与技术能力。正如自动驾驶的早期功能(例如车道保持辅助与紧急制动)仍然让驾驶员保持控制权一样,Agentic AI 的初始阶段主要通过强化学习和对话式 AI 等工具来增强人类设计人员的能力。随着阶段不断提升,系统将承担越来越多的责任:第 4 级引入协同编排的多智能体工作流,而第 5 级则实现完全自主化,类似于自动驾驶汽车能够在复杂环境中无需人工干预完成驾驶。
自动驾驶的类比强调了在这一演进过程中“信任”与“渐进式采用”的重要性。正如驾驶员需要逐步建立对自动驾驶系统的信心一样,设计人员也需要逐渐信任 AI 系统来承担关键任务。这种信任通过透明性、可解释性以及能力的持续渐进提升来建立,从而确保人类设计人员始终保持总体控制,同时获得 Agentic AI 所带来的生产效率提升。
AI 超级周期带来了双重机遇:一方面是为 AI 设计更强大的芯片,另一方面是利用 AI 变革芯片设计流程本身。向 Agentic AI 的转变至关重要,因为它有望实现复杂工作流程的自动化并显著提升生产效率。从孤立工具演进到自主化、集成化的设计生态系统,这一过程需要克服数据共享、安全性以及系统集成等方面的挑战。这不仅要求技术层面的进步,也需要设计方法论的根本性变革,包括产业协作、开放标准的建立以及从业人员技能的全面升级。通过结合加速计算、仿真技术、优化算法以及 AI 发展趋势,我们能够构建与人类设计师协同工作的智能系统。未来的设计将是协作化与互联化的,现在正是行业构建 Agentic 框架、定义下一代技术创新范式的关键时刻。
摘录自 Powering the AI Supercycle: Design for AI and AI for Design. Anirudh Devgan.