DOI:10.13290/j.cnki.bdtjs.2003.07.015 EDA 技术专栏 静态时序分析中的门延时计算 * ﹡ 邵波,杨华中,罗嵘,汪蕙 (清华大学电子工程系,北京 1 0 0 0 8 4 ) 摘要:静态时序分析由于速度快和容量大而广泛应用于时序验证,而门延时的计算则是静态时序分析 中的关键部分。以前利用等效输出驱动点导纳函数相等原理产生的模型,由于不能很好的与等效电容公式 结合,门延时的计算存在过于悲观性或乐观性结果。本文采用输出驱动导纳和互连线拓扑结构相结合的方 法, 对门延时负载模型进行了改进,很好地与等效电容计算结合,保证了静态时序分析的准确性。 关键字:静态时序分析;门延时;输出驱动点导纳函数;等效电容 中图分类号:TN702 文献标识码:A 文章编号:1003-353X(2003)07-0043-04 Gate delay computing in static timing analysis SHAO Bo YANG Hua-zhong LUO Rong WANG Hui (Department of Electronic Engineering, Tsinghua University, Beijing 100084, China) Abstract: Static timing analysis is widely applied in timing verification because of its high speed and great capacity. The gate delay computing is a critical part of static timing analysis. The old gate delay models utilizing the theory that equivalent output driving point admittance formulation is equal can’ t combine with equivalent capacitance formulation very well, which results in the too pessimistic or optimistic gate delay. This paper takes output driving point admittance and intercon- nect structure into account in calculating the equivalent capacitance of the driver, which guarantees the accuracy of static timing analysis. K e y w o r d s : Static timing analysis;Gate delay;output driving point admittance formulation; equivalentcapacitance 1 引言 所有时序路径,计算信号沿(上升沿或下降沿)在 传播过程的延时,然后检查在最坏情况下电路中是 在集成电路设计过程中,模拟方法是应用最多 否存在建立时间和保持时间不满足要求的器件,从 的验证时序正确与否的手段,然而,模拟方法在微 而确认被验证的电路是否存在时序问题。它们又分 系统芯片(SoC)时代正面临严竣的挑战。传统的逻 别通过对最大路径延迟和最小路径延迟的分析得 辑模拟方法虽然比较快,但需要输入向量作为激 到。静态时序分析不需要输入向量、运行速度快、 励,给使用带来很多不便;更为严重的是其精度不 占用内存少,因而成为 SoC 时代最主要的时序验证 够高,不能处理 SoC 时代越来越严重的互连线的耦 手段。延时计算和最长 / 最短路径分析是静态时序 合电容、电感效应。电路模拟方法虽然能非常精确 分析的关键。由于互连线结构 [1] 对门延时的影响非 地计算 S o C 时代的各种效应,但其速度太慢,容 常大,必须在门延时模型中充分考虑这一因素才能 量也太小。静态时序分析技术通过提取整个电路的 确保静态分析结果的正确性。 ﹡国家重点基础研究发展规划(G 1 9 9 9 0 2 2 9 0 3 ) 、国家自然 科 学 杰 出 青 年 基 金 ( 6 0 0 2 5 1 0 1 ) 和 “ 8 6 3 ”计 划 (2 0 0 2 A A 1 Z 1 4 6 0 )项目。 Ju ly 2003 本文提出新的Π模型方法,结合了门的等效电 容 [3] 来计算门的延时,我们的方法结合门的互连线 Semiconductor Technology Vol. 28 No. 7 43 EDA 技术专栏 负载的拓扑结构和门负载三阶矩求解的方法,采用 并不理想, 所以我们提出了新的模型。模型中电 [4]中提出的等效电容的求解公式,求出门延时计 容的值也采用门输出驱动点导纳函数和RC树的驱动 算模型,相比上述两种方法,在静态时序分析中更 点导纳函数前三阶近似相等原理 [4] 推出来,设该驱 为合理。 动点导纳函数为 Y π的 T a y l o r 展开式: 2 新的门延时模型 Yπ=sC2+ sC1 1 + sRC1 (3) 2.1 新的门延时模型 在[4]中,作者提出了利用Π型的RC模型来近 似门的互连线输出负载,同时考虑了负载的屏蔽效 应。用该模型等价地计算出门输出驱动点导纳函数 前三阶系数。 Y(s) R2 C2 R1 =(C1+C2)+ ∑ (−1) n −1 R n−1C1n s n (4) n =2 前三项对比得: C1+C2=y1 (5) C1= y 22 / y 3 (6) 由(5),(6)得: Ri C1 R3 Rj C3 C2=y1- y 22 / y 3 Ci (7) 考虑到互连线金属电阻的屏蔽效应以及互连线 的分布特性,对于模型中的电阻 R 1 而言,如图 3 所 Cj 图1 ∞ 示,需要求 R C 树的等效电阻,采用的方法是,将 驱动点导纳函数和门负载 RC 树 Rpath1Cpath1 图 1 中 Y(s)表示准确的 RC 树的驱动点导纳函 数,在 s = 0 的 Taylor 展开式表示如下: Y(s)= RpathnCpathn (1) 图3 具有分支的 RC 树 将门的输出的 RC 树的互连线负载等效负载为 分支中的接地电容去掉,而保留串联的电阻,这时 Π 模 型 , 如图 2 。 电路中的电阻连接主要以节点之间的串并联的形式 R1 C1 图2 出现,则等效电阻 R e q , Req=Rpath1∥Rpath2∥…∥Rpathn C2 在[4]中,我们可以看到 R 1 一般取 等效的Π模型 通过Π模型得到的门输出驱动点导纳函数和Y R1=- y / y 2 3 12 R 25 e q C2=y1- y 22 / y 3 3 2 12 R ,所 25 eq 以我们新的模型,如图 4 : (s)的前三项对比得出: C1= y 22 / y 3 (8) (2) y1 - y 22 / y 3 y22 / y3 尽管以往模型能够很好地表示等效的输出驱动 点导纳函数,但是利用等效电容计算的门延时结果 44 半导体技术第 2 8 卷第 7 期 图4 新模型 二 OO 三年七月 EDA 技术专栏 2.2 与门 等效电容模型 R R 1 C 这样产生我们新的Π模型,由于传统的门延时 R 2 C R 3 C R 4 5 C R C 6 C 模型中门负载是一个电容, [5]提出了利用平均电流 图6 相等的原理, 将门负载Π模型,转换为单个电容的 等效电容 C eff 的门负载模型,其等效电容的公式如 R R 下 : Ceff R C ( RC1 ) 2 RC1 = C2 + C1 1 − + tx tx t D − 2 t x tD − 2 e −( tD −t x ) RC1 (1 − e −t x RC1 ) 测试电路2 的主电路 C R C 图7 R R C C C 测试电路2 的分支电路 开端 R C Π模型(我们在这里称作1 / 6 , 5 / 6 法)结 果进行比较,不同测试电路的测试结果如表 1 ~ 表4 。 (9) 其中: 可以看出,我们的模型在门延时的计算方面要 比开端 RC Π模型更接近 Hspice 测试结果,开端RC tD=td+tt/2 (10) Π模型平均误差在50%~80%之间, 而我们的模型 tx=td+tt/2-0.5tf (11) 平均误差在 5 % ~1 5 % 之间;而与 O ’B r i e n / t d 、t f 分别表示输出门延时和门输出的下降时间, Savarino Π模型相比, 由于O’ Brien/Savarino Π 它们是由 k 因子表达式来决定的;t t 表示输入信号 模型测试结果有很多情况要比Hspice测试结果小很 的传输时间,它是已知的。k 因子表达式: t d = (k1 + k 2CL )t t + k 3C L3 + k 4CL + k 5 表1 (12) R/Ω 电路1 t t 为1ps , C为0.03pF, ( 单位s) Hspice结果 Y表达式法 1/6,5/6法 本模型 40 3.90E-10 3.93E-10 4.19E-10 3.94E-10 (13) 240 3.42E-10 3.18E-10 3.66E-10 3.30E-10 式中 C L 表示门负载所带电容,各个 k 及 k ' 表 示 k 因子表达式的参数 [ 3 ] 。 440 2.82E-10 2.36E-10 3.05E-10 2.54E-10 640 2.09E-10 1.84E-10 2.57E-10 1.99E-10 880 1.70E-10 1.57E-10 2.27E-10 1.68E-10 t f = (k + k C L )t t + k 3C + k C L + k 5 ' 1 ' 2 2 L ' 4 3 实验结果 我们选取了与门(and),在 TSMC 库 0.18µm 工 表2 电路1tt 为0.2ns , C为0.03pF, (单位s) 艺 IP 库中的代号(AND2 × 2),测试电路我们选取 了分别为不具有分支的测试电路 1 (如图 5 )和具 有分支测试电路 2(如图6 的主电路及如图7 的分支 R/Ω Hspice结果 Y表达式法 1/6,5/6法 本模型 40 4.18E-10 4.18E-10 4.20E-10 4.19E-10 240 3.65E-10 3.58E-10 3.77E-10 3.67E-10 440 2.84E-10 2.94E-10 3.29E-10 3.09E-10 电路),这样的分支电路有相同的两路,并且这两 640 2.33E-10 2.46E-10 2.88E-10 2.61E-10 个分支同时接于主电路图 6 的 1 ,2 ,3 ,4 ,5 , 880 1.85E-10 2.16E-10 2.57E-10 2.28E-10 6 节点处。在测试过程中,我们改变门的输入传输 时间(t t )和负载电容值(C ),并 且 采 用 我 们 表3 的模型,和 H s p i c e 仿真结果,以及 O ’B r i e n / 节点 Hspice结果 Y表达式法 1/6,5/6法 本模型 1 1.06E-09 7.97E-10 1.20E-09 1.05E-09 2 8.22E-10 3.62E-10 1.07E-09 8.17E-10 3 5.85E-10 2.31E-10 9.39E-10 6.10E-10 4 3.60E-10 2.03E-10 8.31E-10 4.69E-10 5 2.41E-10 1.99E-10 7.52E-10 4.00E-10 6 2.13E-10 2.02E-10 6.10E-10 2.97E-10 Savarino Π模型(我们在这里称作 Y 表达式法), 与门 R R C R C 图5 Ju ly 2003 R C 测试电路1 R C C 电路2t t 为1ps ,C为0.02pF,R为500Ω, (单位s) Semiconductor Technology Vol. 28 No. 7 45 EDA 技术专栏 表4 电路2 tt 为0.2ns , C为0.02pf, R 为500 Ω, (单位s) 4 结论 静态时序分析中的门延时模型对于正确进行静 节点 Hspice结果 Y表达式法 1/6,5/6法 本模型 1 1.08e-09 8.75e-10 1.21e-09 1.09e-09 态时序分析有着重要的意义,我们结合了等效电容 2 8.42e-10 4.97e-10 1.09e-09 8.93e-10 和门负载的互连线拓扑架构两个概念,提出了新的 3 6.05e-10 3.38e-10 9.73e-10 7.13e-10 门延时模型。通过实验结果说明,它克服了以前门 4 3.80e-10 2.85e-10 8.71e-10 5.84e-10 延时模型过于悲观和乐观的计算结果,较好地保证 5 2.61e-10 2.66e-10 7.95e-10 5.11e-10 了静态时序分析的精度。下一步的工作可以集中于 6 2.33e-10 2.61e-10 6.53e-10 3.88e-10 门负载是互连线时,存在串扰的情况下的模型,这 多,甚至相对误差达到 6 0 %,而在静态时序分析 中,这种情况是不允许的,它会造成时序分析失 败,我们的模型基本相对误差一般在 5% ~10 %左 右,较好地克服了这种乐观性,在静态时序的验证 样可以使模型更加全面。 参 考 文 献: [1] PUTAUNDA R.Auto-delay: a program for automatic calculation of delay in LSI/VLSI chips.in Proc 19th 方 面 更 可 靠 ,更 精 确 。 Desgin Automation Conf, June 1981:616-621. 除了上述关于与门(a n d )的测试外,我们 [2] 还做了反相器(i n v e r t e r ),或门( o r ) ,加法器 1993:221-223. (a d d )的测试,同时我们也使用 s y n o p s y s 库 0 . 1 8 µm 工艺IP 库中相同器件进行测试,都有相似 [3] RA T Z L A F F C ,P U L L E L A S ,P I L L A G E L T . m o d - eling the RC interconnect effects in a hierarachical 的结果和结论。但是我们也发现,如果上述三种模 timing analyzer.in Proc Custom Integrated Circuits 型测试结果与Hspice的结果相比误差都较小时(大 致5%~10%), 我们的模型并不明显比其他模型优 WESTE N H , E SHRAGHIAN K.Principles of CMOS VLSI Design. New York: Addison Wesley, 2nd ed., C o n f ,M a y 1 9 9 2 . [4] KAHNG A B MUDDM S.Efficient gate delay modeling 越。这点可以由下面这个例子说明,我们对工业界 for large interconnect loads.Proc. IEEE Multi-Chip 中一实际电路进行测试,其门负载有 100 个电阻, Module Conf.,1996:202 -207. 100 个电容的有分支电路(简称有分支)和一个门 负载 14 个电阻和 14 个电容的无分支电路(简称无 分 支 ),其 测 试 结 果 如 表 5 。 [5] QI A N J,P U L L E L A S , PI L L A G E L . m o d e l i n g t h e “effective”capacitance for the RC interconnect of CMOS gates,”IEEE Trans. Computer-Aided Design, Dec. 1994. 表 5 工业界一实际电路的测试结果(单位 s ) 电路 Hspice Y表达 1/6, 类型 结果 式法 5/6法 本模型 无分支 1.950000e-10 2.102680e-10 2.101796e-10 2.101735e-10 有分支 6.498000e-10 6.504951e-10 6.574196e-10 6.576131e-10 46 半导体技术第 2 8 卷第 7 期 作者简介: 邵 波 清华大学00级硕士生; 杨华中 博士,清华大学电子工程系博导,教授; 罗 嵘 博士, 清华大学电子工程系副教授; 汪 蕙 博士, 清华大学电子工程系博导, 教授。 二 OO 三年七月