Uploaded by 17212020121

静态时序分析中的门延时计算 邵波

advertisement
DOI:10.13290/j.cnki.bdtjs.2003.07.015
EDA 技术专栏
静态时序分析中的门延时计算 * ﹡
邵波,杨华中,罗嵘,汪蕙
(清华大学电子工程系,北京 1 0 0 0 8 4 )
摘要:静态时序分析由于速度快和容量大而广泛应用于时序验证,而门延时的计算则是静态时序分析
中的关键部分。以前利用等效输出驱动点导纳函数相等原理产生的模型,由于不能很好的与等效电容公式
结合,门延时的计算存在过于悲观性或乐观性结果。本文采用输出驱动导纳和互连线拓扑结构相结合的方
法, 对门延时负载模型进行了改进,很好地与等效电容计算结合,保证了静态时序分析的准确性。
关键字:静态时序分析;门延时;输出驱动点导纳函数;等效电容
中图分类号:TN702
文献标识码:A
文章编号:1003-353X(2003)07-0043-04
Gate delay computing in static timing analysis
SHAO Bo
YANG Hua-zhong
LUO Rong
WANG Hui
(Department of Electronic Engineering, Tsinghua University, Beijing 100084, China)
Abstract: Static timing analysis is widely applied in timing verification because of its high speed
and great capacity. The gate delay computing is a critical part of static timing analysis. The old gate
delay models utilizing the theory that equivalent output driving point admittance formulation is
equal can’
t combine with equivalent capacitance formulation very well, which results in the too
pessimistic or optimistic gate delay. This paper takes output driving point admittance and intercon-
nect structure into account in calculating the equivalent capacitance of the driver, which guarantees
the accuracy of static timing analysis.
K e y w o r d s : Static timing analysis;Gate delay;output driving point admittance formulation;
equivalentcapacitance
1
引言
所有时序路径,计算信号沿(上升沿或下降沿)在
传播过程的延时,然后检查在最坏情况下电路中是
在集成电路设计过程中,模拟方法是应用最多
否存在建立时间和保持时间不满足要求的器件,从
的验证时序正确与否的手段,然而,模拟方法在微
而确认被验证的电路是否存在时序问题。它们又分
系统芯片(SoC)时代正面临严竣的挑战。传统的逻
别通过对最大路径延迟和最小路径延迟的分析得
辑模拟方法虽然比较快,但需要输入向量作为激
到。静态时序分析不需要输入向量、运行速度快、
励,给使用带来很多不便;更为严重的是其精度不
占用内存少,因而成为 SoC 时代最主要的时序验证
够高,不能处理 SoC 时代越来越严重的互连线的耦
手段。延时计算和最长 / 最短路径分析是静态时序
合电容、电感效应。电路模拟方法虽然能非常精确
分析的关键。由于互连线结构 [1] 对门延时的影响非
地计算 S o C 时代的各种效应,但其速度太慢,容
常大,必须在门延时模型中充分考虑这一因素才能
量也太小。静态时序分析技术通过提取整个电路的
确保静态分析结果的正确性。
﹡国家重点基础研究发展规划(G 1 9 9 9 0 2 2 9 0 3 ) 、国家自然
科 学 杰 出 青 年 基 金 ( 6 0 0 2 5 1 0 1 ) 和 “ 8 6 3 ”计 划
(2 0 0 2 A A 1 Z 1 4 6 0 )项目。
Ju ly
2003
本文提出新的Π模型方法,结合了门的等效电
容
[3]
来计算门的延时,我们的方法结合门的互连线
Semiconductor Technology Vol. 28 No. 7
43
EDA 技术专栏
负载的拓扑结构和门负载三阶矩求解的方法,采用
并不理想, 所以我们提出了新的模型。模型中电
[4]中提出的等效电容的求解公式,求出门延时计
容的值也采用门输出驱动点导纳函数和RC树的驱动
算模型,相比上述两种方法,在静态时序分析中更
点导纳函数前三阶近似相等原理 [4] 推出来,设该驱
为合理。
动点导纳函数为 Y π的 T a y l o r 展开式:
2
新的门延时模型
Yπ=sC2+
sC1
1 + sRC1
(3)
2.1 新的门延时模型
在[4]中,作者提出了利用Π型的RC模型来近
似门的互连线输出负载,同时考虑了负载的屏蔽效
应。用该模型等价地计算出门输出驱动点导纳函数
前三阶系数。
Y(s)
R2
C2
R1
=(C1+C2)+
∑ (−1)
n −1
R n−1C1n s n
(4)
n =2
前三项对比得:
C1+C2=y1
(5)
C1= y 22 / y 3
(6)
由(5),(6)得:
Ri
C1
R3
Rj
C3
C2=y1- y 22 / y 3
Ci
(7)
考虑到互连线金属电阻的屏蔽效应以及互连线
的分布特性,对于模型中的电阻 R 1 而言,如图 3 所
Cj
图1
∞
示,需要求 R C 树的等效电阻,采用的方法是,将
驱动点导纳函数和门负载 RC 树
Rpath1Cpath1
图 1 中 Y(s)表示准确的 RC 树的驱动点导纳函
数,在 s = 0 的 Taylor 展开式表示如下:
Y(s)=
RpathnCpathn
(1)
图3
具有分支的 RC 树
将门的输出的 RC 树的互连线负载等效负载为
分支中的接地电容去掉,而保留串联的电阻,这时
Π 模 型 , 如图 2 。
电路中的电阻连接主要以节点之间的串并联的形式
R1
C1
图2
出现,则等效电阻 R e q ,
Req=Rpath1∥Rpath2∥…∥Rpathn
C2
在[4]中,我们可以看到 R 1 一般取
等效的Π模型
通过Π模型得到的门输出驱动点导纳函数和Y
R1=- y / y
2
3
12 R
25 e q
C2=y1- y 22 / y 3
3
2
12
R ,所
25 eq
以我们新的模型,如图 4 :
(s)的前三项对比得出:
C1= y 22 / y 3
(8)
(2)
y1 - y 22 / y 3
y22 / y3
尽管以往模型能够很好地表示等效的输出驱动
点导纳函数,但是利用等效电容计算的门延时结果
44 半导体技术第 2 8 卷第 7 期
图4
新模型
二 OO 三年七月
EDA 技术专栏
2.2
与门
等效电容模型
R
R
1
C
这样产生我们新的Π模型,由于传统的门延时
R
2
C
R
3
C
R
4
5
C
R
C
6
C
模型中门负载是一个电容,
[5]提出了利用平均电流
图6
相等的原理, 将门负载Π模型,转换为单个电容的
等效电容 C eff 的门负载模型,其等效电容的公式如
R
R
下 :
Ceff
R
C


( RC1 ) 2
RC1
= C2 + C1 1 −
+
tx
tx


 t D − 2 t x  tD − 2





e
−( tD −t x )
RC1
(1 − e
−t x
RC1


)



测试电路2 的主电路
C
R
C
图7
R
R
C
C
C
测试电路2 的分支电路
开端 R C Π模型(我们在这里称作1 / 6 , 5 / 6 法)结
果进行比较,不同测试电路的测试结果如表 1 ~
表4 。
(9)
其中:
可以看出,我们的模型在门延时的计算方面要
比开端 RC Π模型更接近 Hspice 测试结果,开端RC
tD=td+tt/2
(10)
Π模型平均误差在50%~80%之间,
而我们的模型
tx=td+tt/2-0.5tf
(11)
平均误差在 5 % ~1 5 % 之间;而与 O ’B r i e n /
t d 、t f 分别表示输出门延时和门输出的下降时间,
Savarino Π模型相比,
由于O’
Brien/Savarino Π
它们是由 k 因子表达式来决定的;t t 表示输入信号
模型测试结果有很多情况要比Hspice测试结果小很
的传输时间,它是已知的。k 因子表达式:
t d = (k1 + k 2CL )t t + k 3C L3 + k 4CL + k 5
表1
(12)
R/Ω
电路1 t t 为1ps , C为0.03pF, ( 单位s)
Hspice结果 Y表达式法
1/6,5/6法
本模型
40
3.90E-10
3.93E-10
4.19E-10
3.94E-10
(13)
240
3.42E-10
3.18E-10
3.66E-10
3.30E-10
式中 C L 表示门负载所带电容,各个 k 及 k ' 表
示 k 因子表达式的参数 [ 3 ] 。
440
2.82E-10
2.36E-10
3.05E-10
2.54E-10
640
2.09E-10
1.84E-10
2.57E-10
1.99E-10
880
1.70E-10
1.57E-10
2.27E-10
1.68E-10
t f = (k + k C L )t t + k 3C + k C L + k 5
'
1
'
2
2
L
'
4
3 实验结果
我们选取了与门(and),在 TSMC 库 0.18µm 工
表2 电路1tt 为0.2ns , C为0.03pF, (单位s)
艺 IP 库中的代号(AND2 × 2),测试电路我们选取
了分别为不具有分支的测试电路 1 (如图 5 )和具
有分支测试电路 2(如图6 的主电路及如图7 的分支
R/Ω
Hspice结果
Y表达式法
1/6,5/6法
本模型
40
4.18E-10
4.18E-10
4.20E-10
4.19E-10
240
3.65E-10
3.58E-10
3.77E-10
3.67E-10
440
2.84E-10
2.94E-10
3.29E-10
3.09E-10
电路),这样的分支电路有相同的两路,并且这两
640
2.33E-10
2.46E-10
2.88E-10
2.61E-10
个分支同时接于主电路图 6 的 1 ,2 ,3 ,4 ,5 ,
880
1.85E-10
2.16E-10
2.57E-10
2.28E-10
6 节点处。在测试过程中,我们改变门的输入传输
时间(t t )和负载电容值(C ),并 且 采 用 我 们
表3
的模型,和 H s p i c e 仿真结果,以及 O ’B r i e n /
节点
Hspice结果
Y表达式法
1/6,5/6法
本模型
1
1.06E-09
7.97E-10
1.20E-09
1.05E-09
2
8.22E-10
3.62E-10
1.07E-09
8.17E-10
3
5.85E-10
2.31E-10
9.39E-10
6.10E-10
4
3.60E-10
2.03E-10
8.31E-10
4.69E-10
5
2.41E-10
1.99E-10
7.52E-10
4.00E-10
6
2.13E-10
2.02E-10
6.10E-10
2.97E-10
Savarino Π模型(我们在这里称作 Y 表达式法),
与门
R
R
C
R
C
图5
Ju ly
2003
R
C
测试电路1
R
C
C
电路2t t 为1ps ,C为0.02pF,R为500Ω, (单位s)
Semiconductor Technology Vol. 28 No. 7
45
EDA 技术专栏
表4 电路2 tt 为0.2ns , C为0.02pf,
R 为500 Ω, (单位s)
4 结论
静态时序分析中的门延时模型对于正确进行静
节点
Hspice结果
Y表达式法
1/6,5/6法
本模型
1
1.08e-09
8.75e-10
1.21e-09
1.09e-09
态时序分析有着重要的意义,我们结合了等效电容
2
8.42e-10
4.97e-10
1.09e-09
8.93e-10
和门负载的互连线拓扑架构两个概念,提出了新的
3
6.05e-10
3.38e-10
9.73e-10
7.13e-10
门延时模型。通过实验结果说明,它克服了以前门
4
3.80e-10
2.85e-10
8.71e-10
5.84e-10
延时模型过于悲观和乐观的计算结果,较好地保证
5
2.61e-10
2.66e-10
7.95e-10
5.11e-10
了静态时序分析的精度。下一步的工作可以集中于
6
2.33e-10
2.61e-10
6.53e-10
3.88e-10
门负载是互连线时,存在串扰的情况下的模型,这
多,甚至相对误差达到 6 0 %,而在静态时序分析
中,这种情况是不允许的,它会造成时序分析失
败,我们的模型基本相对误差一般在 5% ~10 %左
右,较好地克服了这种乐观性,在静态时序的验证
样可以使模型更加全面。
参 考 文 献:
[1]
PUTAUNDA R.Auto-delay: a program for automatic
calculation of delay in LSI/VLSI chips.in Proc 19th
方 面 更 可 靠 ,更 精 确 。
Desgin Automation Conf, June 1981:616-621.
除了上述关于与门(a n d )的测试外,我们
[2]
还做了反相器(i n v e r t e r ),或门( o r ) ,加法器
1993:221-223.
(a d d )的测试,同时我们也使用 s y n o p s y s 库
0 . 1 8 µm 工艺IP 库中相同器件进行测试,都有相似
[3]
RA T Z L A F F C ,P U L L E L A S ,P I L L A G E L T . m o d -
eling the RC interconnect effects in a hierarachical
的结果和结论。但是我们也发现,如果上述三种模
timing analyzer.in Proc Custom Integrated Circuits
型测试结果与Hspice的结果相比误差都较小时(大
致5%~10%),
我们的模型并不明显比其他模型优
WESTE N H , E SHRAGHIAN K.Principles of CMOS
VLSI Design. New York: Addison Wesley, 2nd ed.,
C o n f ,M a y 1 9 9 2 .
[4]
KAHNG A B MUDDM S.Efficient gate delay modeling
越。这点可以由下面这个例子说明,我们对工业界
for large interconnect loads.Proc. IEEE Multi-Chip
中一实际电路进行测试,其门负载有 100 个电阻,
Module Conf.,1996:202 -207.
100 个电容的有分支电路(简称有分支)和一个门
负载 14 个电阻和 14 个电容的无分支电路(简称无
分 支 ),其 测 试 结 果 如 表 5 。
[5]
QI A N J,P U L L E L A S , PI L L A G E L . m o d e l i n g t h e
“effective”capacitance for the RC interconnect of
CMOS gates,”IEEE Trans. Computer-Aided Design,
Dec. 1994.
表 5 工业界一实际电路的测试结果(单位 s )
电路
Hspice
Y表达
1/6,
类型
结果
式法
5/6法
本模型
无分支 1.950000e-10 2.102680e-10
2.101796e-10
2.101735e-10
有分支 6.498000e-10 6.504951e-10
6.574196e-10
6.576131e-10
46 半导体技术第 2 8 卷第 7 期
作者简介:
邵 波 清华大学00级硕士生;
杨华中 博士,清华大学电子工程系博导,教授;
罗 嵘 博士,
清华大学电子工程系副教授;
汪 蕙 博士,
清华大学电子工程系博导,
教授。
二 OO 三年七月
Download