基於熱傳導理論的熱佈局演算法

基於熱傳導理論的熱佈局演算法黎靖 Department of Electronic Engineering Southern Taiwan University of Technology Tainan, Taiwan 701, R.O.C. Email: leejing@mail.stut.edu.tw 摘要針對 MCM 設計，本文提出一個以熱傳導理論為基礎的熱斥力佈局演算法(稱為 TFPA)。 TFPA 首先將包括晶片的基板轉換成為一個具有無限個晶片的無邊界基板。然後，每個晶片以熱斥力推動其他的晶片，此熱斥力的建立是類比於熱在基板上的傳導效應。接著，每個晶片將沿著熱斥力的方向移動，直到系統達到力平衡為止。TFPA 可以盡可能將基板上的晶片功率分配均勻，從而得到具備均勻且較低的溫度分佈的佈局結果。相較於傳統的力指向法得到的佈局有嚴重的晶片重疊問題，TFPA 得到的佈局結果，晶片就很分散，只有很少或根本沒有重疊發生。事實上，由 TFPA 得到的初步佈局就非常接近最後的佈局。索引詞—多晶片模組，實體設計，可靠性，熱佈置一、導言無論在晶片封裝亦或印刷電路板（PCB）電路，微電子封裝的趨勢持續朝向更高的封裝密度，更快的速度和更高的功率耗散。此外，在多晶片模組（MCM）的設計中，這些晶片經常被封裝的更緊密，以減少晶片間訊號的傳輸延遲和封裝體積，這種趨勢使得在基板產生更高的熱通量密度。如果熱量沒有適當地移除則可能會發生較高的工作溫度。較高的溫度不僅會經由減緩晶片上電晶體的速度，因而導致電路性能降低外，同時也減少了電路的可靠性。眾所周知，大部分因物理和化學反應導致的元件故障率，會因較高的工作環境而加速[1]。此外，在基板上晶片功耗的分配不均可能會產生熱斑點，產生熱應力。當熱應力夠大，且經過足夠的熱循環，就可能因為焊錫接腳的破裂而導致晶片失效 [2]。在許多 MCM 設計中，熱管理是決定可靠性的最重要因素，因此它應該在封裝過程中儘早被考慮。由於溫度分佈直接取決於晶片佈置的結果，因此加入熱管理考慮的最佳時機應該是在晶片的佈置階段。如果晶片佈置的軟體沒有將熱效應加入考慮的話，那就極可能會將高發熱的晶片佈置於鄰近的位置。當這種情況產生時，即使總消耗功率未超出設計上的限制，仍可能在基板上造成熱斑點的產生。歷史上，已開發的佈置技術主要是著重在電路的可繞線性上。 Sherwani [3]提供了經典的技術的摘要。這些算法通常專注於最小化電路的總繞線長度，此外，有部份方法則著重於降低導線交越及通孔的數量[4]。然而，隨著對高效能且長壽命電子電路需求的增加，以最佳化可靠性為目標的佈置方法被發展出來，包括針對高功率混合電路（PHC） [5]、針對對流冷卻的印刷電路板設計 [6] - [11]、針對超大型積體電路設計 [12]，[13]，及針對多晶片模組設計等[14] - [17]。此外，部分有關佈置技術的研究則同時兼顧對可靠性和繞線性的需求，包括針對對流冷卻的印刷電路板設計[18] - [21] 及針對高功率混合電路設計[22]。 TCPT-2002-019.R1 1 力指向算法（FDA）已廣泛被應用於 PCB 和 VLSI 設計上的繞線性最優化佈置問題上 [4]，[23] [24]。FDA 是建立於一個受力系統模型上，在此模型中，有導線相連的元件中存在吸引力，而沒有導線相連的元件中則存在排斥力以保持距離。傳統力指向算法並不適合於熱佈置問題（即可靠性最優化佈置問題）。最近， Huang 和 Fu[16]提出一個基於模糊模型的 FDA 應用在 MCM 的熱佈置管理問題。在他們的模糊模型，任兩晶片間存在排斥力，此排斥力正比於兩個晶片的功率乘積，而在兩個晶片之間的距離增加時減少。本文提出了一種新的力指向佈置算法。文中提出的熱力模型是基於類比熱傳導理論，因此它是非常適合解決 MCMs 和混合電路的熱佈置問題。本文的架構如下：第二節描述本文的方法，第三節展示範例與計算結果，結論則擺在第四節。二、方法公式化令 d1，d2，…，dm 代表放置在 MCM 基板上的晶片，（xi，yi）是 di 的直角坐標。熱佈置問題是確定晶片的地點使得該系統的可靠性可以優化。Cook 和 Karp [25] 確認為此問題是 NP - complete 的。因此，為了在合理的計算時間內獲得近似最佳解，某些經驗演算法被導入這個問題上。一般而言，此種問題的經驗演算法可以歸類為兩種不同的形式。第一類的方法採用逐步且明確的經驗法則獲得的初解，通稱為構成性的演算法。另一類的方法則通過局部的變換改進解答，通稱為迭次改進演算法。本文提出的算法屬於構成性的演算法。解決熱佈置問題的步驟分由兩個階段。首先，使用多次反射技術將真實的基板與其上的晶片轉換為具有無限多個晶片的無界基板。接著，採用熱力指向佈局算法確定晶片的位置。 A. 多重反射技術對於 MCM，經由基板側壁散失的熱量與經由基板的頂部和底部散失的熱量相比是微不足道的。因此，基板側壁可以視為完美的絕緣體。由於沒有熱流穿過絕熱邊界並且因為熱傳量與溫度梯度成正比，因此在絕熱邊界的垂直方向溫度梯度為 0。故完美的絕緣體在邊界的垂直方向可視為零溫度梯度。因此，絕熱邊界可以使用如圖 1 所示的反射鏡像熱源取代。以相似的方法，具有數個熱源的四邊絕熱矩形基板可以如圖 2 所示的轉換為帶有無數個鏡像熱源的無界基板。經由此種轉換得到的新架構並不會改變原始問題的溫度分布的情況。一個包括兩個熱源的例子，如圖 2 所示。在第 r 列和第 c 行的鏡像基板，被稱為 r-c  基板。位於 r-c 基板中 dj 的位置表示為 xj r ,c   , y jr ,c  ， 1 L x (r,j c)  (c  )L  ( 1)c (x j  ) 2 2 (1) 1 W y (r,j c)  (r  )W  ( 1) r (y j  ) 2 2 (2) 其中 L 和 W 分別是基板的長度和寬度。如果 dj 位於真正的基板（即 0-0 -基板）上，本文將省略上標，簡單表示其位置為  x j , y j  。 TCPT-2002-019.R1 2 mirror image source Insulated boundary heat source heat source q q q Mirror image region (a) Physical region (b) 圖 1. (a）無限絕緣邊界的熱源及（b）使用一種反射的鏡像源取代絕緣邊界 Y qi qi qi qi W qi qj L qi qj qj qj qj qj qi qi qi qi qj qj qj qj qj qj qj qj W qj qj qj qi qi qi qi qi qi column=-2 column=-1 qi qi qi qi qi qi qi qi qi L qj qj qj qj column=0 (a) qi column=1 qj qj qj qj qj row=2 row=1 row=0 row=-1 X row=-2 column=2 (b) 圖 2. 多重反射技術：（1）矩形區域與絕緣邊界和（二）無界區域無限鏡熱源求解基板的溫度分佈時，邊界的不連續性構成數學求解上的主要困難。透過多重反射法，邊界的效應被隱含於無界基板中；因此，因為邊界不連續造成的數學求解困難被移除。解決無界基板的溫度分佈問題比原來的有限域問題來得容易。早先的一些研究已使用多重反射技術與迭加原理去預測電子設備的溫度[26]-[28]。 B. 熱斥力模型在無界的物體上，熱從每個熱源傳遞到其他地方，在穩態條件中，熱通量隨著與熱源距離的平方而衰減。本文提出的熱斥力模型是類比於熱傳導機制而建構的。在此模型中，每個晶片 dj 推開其他晶片 di 的力是與 dj 的熱功率成正比，而與它們之間的距離平方成反比。這一敘述可以表示為 f i,(r,jc)   i  TCPT-2002-019.R1 qj ( ri,(r,jc) ) 2 3 (3) 其中 fi , rj ,c  是在 r-c-基板中的 dj 施加於實際基板中的 di 的力; i 是 di 的熱敏感因素，正常晶片  i  1 ，若晶片對溫度敏感，則  i  1 ; qj 是晶片 dj 的熱功率。 ri,(r,j c) = (x (r,j c)  x i )2  (y (r,j c)  yi )2 (4) fi , rj ,c  在 x 軸分量為 qj c) fx (r, i, j   i  ( r (r, c) 2 i, j ) c)  cos(θ (r, i, j ) (5) c)  sin( θ (r, i, j ) (6) 在 y 軸分量為 c) fy (r, i, j   i  qj ( r (r,c) 2 i, j ) 其中  y (r,j c)  y i  c)  (r, c)  θ (r,  atan2 i, j x x  j i   (7) 擴充公式(3)到包括所有 m 個晶片，可得到     a 1 (  a,  c)  a Fz i     fz i,(a,jc)   fz i,(r,ja)  fz i,( j r, a) fz i, j     fz i, j a 1 c   a r   a 1 j1  m  (8)  其中 z 可以是 x 或 y 。理論上，公式（8）中 a 的值是無限大。然而，由於 fzi, j  隨著距 r ,c 離的平方而快速衰減，因此在實用上 a 不需要太大。在附錄中我們證明了將 a 設為 5 就已經足夠正確了。因此，在本文的方法中實際的基板被轉換成原來面積的 121 倍。 C. 熱斥力佈局算法晶片的位置是經由求解 Fzi =0 得到的。本文採用改進的牛頓-拉森法求解此方程式組。為了應用改進的 NR 方法，我們必須先求出 Fzi 的偏導數     a 1 ' ' (  a,  c)  a F' z i     f ' z i,(a,jc)   f ' z i,(r,ja)  f ' z i,( j r, a) f z i, j     f z i, j a 1 c   a r   a 1 j1  m   (9) 其中 ' fx ' (r,c) i, j fy  (r,c) i, j c) dfx (r, i, j  dx i c) dfy (r, i, j dy i   i  qj ( r   i  (r,c) 3 i, j qj ( r (r,c) 3 i, j 接著，疊代過程的移動距離 d i 為 TCPT-2002-019.R1 ) 4 )   (10)   (11) c)  3cos 2 (θ (r, i, j ) - 1 c)  3sin 2 (θ (r, i, j ) - 1 z i  0.5  Fz i F' z i (12) 式（12）中的係數採用 0.5 的原因是因為任兩個晶片會互推彼此，因此實際上每個晶片只需要移動 0.5 倍的指定距離。 procedure TFPA(Q, A, X, Y, L, W, ε1, ε2) // Q={qi︱1≦i≦m}, A = {  i ︱1≦i≦m }, (X, Y)={(xi, yi)︱1≦i≦m } // // L and W are the length and the width of the substrate. // // ε1 and ε2 are two stopping criterion values. // begin do Random(X, Y) // 0 < xi < L, 0 < yi < W // Norm←a large value do Old_Norm←Norm Norm←0 for i←1 to m ( Fx i , Fy i )← Equation (8) ( F ' x i , F' y i )← Equation (9) ( x i , y i )←0.5 ×( Fy i Fx i , ) F' x i F' y i while xi+ x i  L or xi+ x i  0 do x i ← x i / 2 repeat while yi + y i  W or yi + y i  0 do y i ← y i / 2 repeat (xi, yi)←(xi+ x i , yi + y i ) Norm← Fx i  Fyi repeat while Old_Norm  Norm Norm  ε1 while Norm  ε 2 output(X, Y) end 圖 3.TFPA 程序在每次迭代後，  xi , yi  的新位置為 z i new   z i  z i TCPT-2002-019.R1 5 (13) 在求解的過程中，如果一個新的位置 zi （新）是跑到真正基板以外的區域，這顯然是不合理的。為了避免這種不合理的情況， zi 被修改如下：如果在式（13）中， zi  zi 的值超出範圍， zi 值會被降低一半，並重複此過程直到 zi  zi 在實際基板中。本文的演算法(稱為熱斥力佈置法)如圖 3 所示。 TFPA 首先產生一個隨機的初始解。接著，利用改良 NR 方法得到新的解，迭代此步驟，直到得到收斂解。為了正確定義收斂解，本文定義 Norm    Fx i  Fy i  m (14) i 1 Old _ Norm 代表前一解的位置。 1 和  2 是兩個停止的臨界值，實際值由求解者根據實際的問題訂定。  1 和  2 的最佳值需要一些試驗，但本文的研究發現如果設置  1 和  2  0.01 ，得到的收斂解差別很小。因此，為了提供一個客觀比較的基礎，本研究將 1 和  2 設置為 0.01。在 Old _ Norm  Norm / Norm  1 情況下，本文就視為尚未得到收斂解，並且 TFPA 繼續迭代以取得新的位置。在 Old _ Norm  Norm / Norm  1 但是 Norm  2 情況下，代表目前的解被困在局部優化的情況，無法進ㄧ步改善。因此，TFPA 從新隨機產生新的初始解，並且重新執行整個過程。在 Old _ Norm  Norm / Norm  1 和 Norm   2 情況下，得到的解被視為收斂，TFPA 的程序終止。 D. 算法驗證在 TFPA 中，熱斥力 Fzi s 是類比於無界區域中的熱通量。所以， F zi s 是相當於熱通量梯度。由於熱通量梯度總是指向較低溫的區域，因此 TFPA 總是將晶片推往較低溫度的區域，因此可以產生一個溫度分佈均勻的收斂解。 E. 空間複雜度 TFPA 需要 10m 的單元記憶體存儲下列變數 i , qi , xi , yi , Fxi , Fyi , F xi , F yi , xi , yi 1  i  m 。因此，TFPA 的空間複雜度為 O  m  。 F.時間複雜度對每一個晶片，TFPA 都需要使用一維 NR 法 2m 次。由於 NR 法所需要的時間主要是用在計算公式（8）及（9）中，因使在以下分析中，其它步驟所需要的時間將被忽略 r ,c r ,c 不計。在計算公式（8）及（9）的每一步，評估 fzi, j  和 f z i, j  的次數等於 5 a 1   a  1  2  2   121m      j 1  a 1  c  a r  a 1   m 令評估 fzi, j  和 f z i, j  所需要的時間為一單位時間。則每次執行 TFPA 程序需要 242m2 單位 r ,c r ,c 時間。從以上分析，可以得出結論，對於每次的迭代，TFPA 的時間複雜度是 O  m 2  。得到收斂解所須要的迭代的次數，取決於問題的大小（m），晶片的熱功率及停止臨界值（  1 和  2 ）。 G. TFPA 的準確性和限制 TCPT-2002-019.R1 6 特定解的準確性至少取決於三個因素。首先是 TFPA 模型是否能完全的對應至實際的物理問題上。在 TFPA，封裝結構簡化為一矩形平面，同時假設基板材料的導熱係數具有均勻且無向性的性質，而且基板邊緣被視為完全絕熱。所有這些簡化和假設都導致一些錯誤。但是，因為 TFPA 總是能得到晶片間的距離盡量遠離的解，因此，即使實際的封裝不能滿足這些假設， TFPA 仍然可以用來獲取一個“好”的解。第二，TFPA 忽視晶片的尺寸，將每個晶片視為一個點。這種簡化問題可能導致晶片重疊。然而，在第三節中，我們將發現重疊問題其實並不嚴重。最後，解的精度受到公式（8）中截斷高階項的影響。然而，我們已經在附錄中證明這個誤差並不會顯著影響解的正確性。三、實例及計算結果 TFPA用C語言實現，並在一台 300百萬赫Pentium II個人電腦上執行。由於缺乏公開的MCM標準測試電路及封裝數據，本文只將本方法應用在一些已經發表的範例上。為了簡化分析，所有的例子都視為具有相同的封裝方式和冷卻條件，但它們可能有不同的幾何尺寸。基板上晶片的溫度分佈是利用TAMS程式計算 [29]，[30]。圖4 MCM的TAMS模型如圖4所示。TAMS模型中不同的層模擬MCM的不同層次的結構，如多層基板，環氧層和散熱片等。在每一層，材料的物理特性都被假定為線性，均勻、和無方向性。在層與層之間，溫度和熱流量被假設為具備連續性。在MCM陶瓷層和外蓋之間的空間，忽略空氣傳導及對流的效應（因此得到的結果其實是最不利情況下的結果）。多層基板（即 2MgO  2 Al2O3  5SiO2 基板），環氧層和散熱片的熱導率，分別是 2.5 103W / mmC,1.17 103W / mmC 和 1.95 101W / mm C 。由於在我們的例子中，平均熱通量非常高，因此我們選擇基板那ㄧ面的冷卻方式為4米/秒的強制對流，散熱片那ㄧ面的冷卻方式為0.3米/秒的衝擊強制對流。對應這兩種冷卻方式的平均傳熱係數 h1 和 h2 分別為 3.26 105W / mm C 和 1.94 104 W / mm C 。 Y W h1 Chips 0 Epoxy L Heat sink X Multiplayer substrate h2 圖 4. MCM 模型的示意圖晶片的故障率是採用 Arrhenius 公式估計 E  1 1  T  i   0  exp  a      k  298 T   其中 TCPT-2002-019.R1 7 （15） T 和 0 分別是在 TK 和 298 K 時的故障率; Ea 是活化能（eV）; k 是玻爾茲曼常數。為了計算 MCM 的系統故障率，我們需要具體決定公式(15)中的參數的值。在不失一般性的條件下，我們假設所有的晶片都有相同的 0 和 Ea 分別是 1Fit （即 109 /小時）和 1 eV。具有 m 個晶片的 MCM 的系統故障率 S 被計算為個別晶片故障率的總和。即 m S   T  i  （16） i 1 A.晶片相同的例子前兩個例子分別分別包括 12 個和 16 個晶片的 MCM。這兩個例中的晶片都是 1 瓦，邊長 5.1 毫米的正方形晶片。兩個例子的基板大小也ㄧ樣，基板的長度，寬度和厚度分別為 30.5 毫米，30.5 毫米和 5 毫米。由 TFPA 獲得的佈置與溫度分佈如圖 5（a）和（b）所示。由圖可知，晶片是規則放置在基板上，而且晶片的溫度是非常均勻分佈。如我們所預期，在此兩種情況下所得結果是最優的。 118 118 118 117 118 139 139 140 139 139 139 139 139 139 139 139 140 139 139 140 118 118 118 117 140 118 118 118 (a) (b) 圖 5. TFPA 的結果與溫度（℃）分佈：（a）12 晶片的例子，（b）16 晶片的例子。 B. 晶片具有不同消耗功率的的例子接下來的四個例子是引用文獻[16]中的例子。所有的四個案例具有相同尺寸的基板和晶片，但在不同的案例，不同晶片有不同的消耗功率。基板的邊長為 50 毫米、厚度為 5 毫米。晶片也都是邊是 5 毫米的正方形。表一列出每個晶片的消耗功率。接著本文將比較 TFPA 得到的佈置結果與 Huang 和 Fu[16]的結果。為便於說明，本文將 Huang 和 Fu 提出的算法稱為模糊模型力指向算法（FMFDA）。由 TFPA 和 FMFDA 獲得的最高、最低、平均溫度、最大的溫度差值、及系統故障率（即 Tmax, Tmin, Tav, Tmax , S)總結在表二。FMFDA 上晶片的位置直接得自於[16]，但溫度分佈是在本文設定的封裝和冷卻條件下進行分析。如表二所示，比較 TFPA 的結果與 FMFDA 的結果，TFPA 有較低的 Tmax 和相同的 Tmin 。因此，由 TFPA 獲得的 Tav, Tmax 和 S 值，也都低於 FMFDA 得到的。特別值得ㄧ提的是，案例 A 和 B 中， TFPA 結果的 S 分別只有 FMFDA 結果的 15％和 18％。 TCPT-2002-019.R1 8 Table 1. 有不同晶片數目及功耗的 4 個例子 [16]. Cases Number of chips Power dissipation value (W) A 5 0.8, 1.3, 1.5, 1.5, 1.7 B 6 0.5, 0.8, 0.9, 1.1, 1.3, 1.5 C 8 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0 D 10 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2 Table 2. 以表 1 中的案例比較 TFPA 及 FMFDA. Cases Algorithms A B C D FMFDA TFPA FMFDA TFPA FMFDA TFPA FMFDA TFPA Tmax(℃) 119 94 108 86 82 68 81 78 Tmin(℃) 64 64 52 52 44 44 47 47 Tmax =Tmax-Tmin 55 30 56 34 38 24 34 30 Tav(℃) 100.2 82.4 82.2 69.5 62 55.8 64.6 63 S (Fit) 25432 3830 8755 1610 1324 415 1550 1252 為進一步比較這兩個方法，案例 A 和 C 分別得自於 TFPA 和 FMFDA 的詳細晶片的位置與溫度分佈，分別顯示於圖 6（a），6（b）和 7（a），7（b）。顯然，FMFDA 將消耗功率較大的晶片放置在基板的角落，以避免在基板的中央區域產生熱斑點。然而，在角落上的晶片因為沒有足夠的空間傳遞由晶片產生的熱量因此冷卻效果較差，因此 FMFDA 產生的佈置有四個熱斑點在基板四個角落基板如圖 6（a）和（b）。這種情況會在角落處產生嚴重的熱應力問題，從而降低 MCM 的系統可靠性。反之，TFPA 將晶片分開放置，所以每一個晶片都有足夠的散熱面積可以將熱量帶走，因此得到的佈置結果有較低且較均勻的溫到分佈。不過，在熱量由側邊帶走的條件下，FMFDA 可以得到較佳的結果。 TCPT-2002-019.R1 9 109 (1.5W) 119 (1.7W) 94 80 (1.7W) (1.3W) 64 (0.8W) 87 64 (0.8W) 87 (1.5W) (1.5W) (1.3W) 100 109 (1.5W) (b) (a) 圖 6. 案例 A 之佈置與溫度（℃）和消耗功率分佈：（a）FMFDA 之佈置結果（b）TFPA 之佈置結果。 72 (0.8W) 79 (0.9W) 47 (0.4W) 61 (0.8W) 68 55 (1W) (0.6W) 50 (0.5W) 57 (0.7W) 51 (0.5W) 44 (0.3W) 44 (0.3W) 82 (1W) 47 (0.4W) (0.7W) 67 64 (0.8W) 54 (0.6W) (b) (a) 圖 7. 案例 C 之佈置與溫度（℃）分佈和熱耗能對：（a）FMFDA 之佈置結果（b）TFPA 之佈置結果。 C. 不均勻晶片的實例最後的兩個例子是兩個實際販售的消費性微處理器， PowerPC 603 和 604。表三顯示了此二 MCM 的晶片尺寸和消耗功率[31]。不同的晶片具有不同高度，寬度，及消耗功率。PowerPC 604 可以被視為一個極端的例子，因為處理器晶片的最大功耗達 13 瓦，相對高於其他晶片。為比較需要，圖 8（a）和（b）顯示 PowerPC 603 和 604 在 44×44 毫米的基板上的晶片佈局，此佈局結果是來自[31]，圖 8（a）和（b）的溫度分佈結果是在本文的封裝和冷卻條件下分析得到的。 Table 3. PowerPC 603 和 604 MCM 之晶片尺寸和功率 [31]. MCM Processor Bridge Bridge Clock controller buffer Distr. SRAM Tag RAM Bus Buffer Chip size 7.4×11.4 6.7×7.1 7.8×7.4 4.1×4.1 5.7×12.1 9.8×4.1 3.2×1.3 PowerPC (mm) 603 Max. chip 3 0.75 0.5 0.9 1 0.7 0.4 power (W) Chip size 12.4×15.8 6.7×7.1 7.8×7.4 4.1×4.1 5.7×12.1 9.8×4.1 3.2×1.3 PowerPC (mm) 604 Max. chip 13 0.75 0.5 0.9 1 0.7 0.4 power (W) TCPT-2002-019.R1 10 65 (1W) 83 (1W) 58 (0.5W) 85 (0.4W) 107 (0.4W) 89 (0.5W) 85 (1W) 66 (1W) 93 (0.8W) 122 (0.8W) 95 (3W) 180 (13W) 85 (1W) 66 (1W) 66 66 (0.7W) (0.75W) 65 (1W) 83 (1W) 90 (0.7W) 97 (0.75W) (b) (a) 圖 8. PowerPC 603 和 604 之晶片佈局與溫度（℃）分佈和熱耗能[31]：（1）PowerPC 603 的和（b）PowerPC 604 的。由 TFPA 產生的 PowerPC 603 和 604 的初始佈局，分別如圖 9（a）和（b）所示。顯然，初始佈局具備很高的品質; 晶片被分散放置且只有很少的晶片重疊發生在圖 9（a）和（b）中。因此，只需按照設計規則消除初始佈局的重疊，就可以順利的轉換成最終的佈局。最終的佈局顯示於圖 10（a）和（b）。 64 (1W) 65 (1W) 88 (0.4W) 84 85 87 (0.75W)(0.7W) (1W) 94 (3W) 67 (0.75W) 65 60 (0.7W) (0.5W) 67 (1W) 84 (1W) 108 (0.8W) 86 (1W) 67 (1W) 86 (1W) 88 (0.8W) 107 (0.4W) (a) 178 (13W) 88 (0.5W) (b) 圖 9. 得自於 TFPA 的初始佈局：（a）PowerPC 603 的和（b）PowerPC 60 的。 TCPT-2002-019.R1 11 94 (3W) 65 (1W) 86 85 (0.75W) (0.7W) 65 (1W) 90 (1W) 91 (1W) 108 (0.8W) 66 (0.75W) 65 (1W) 66 58 (0.7W) (0.5W) 85 (0.4W) 88 (1W) 65 (1W) 179 (13W) 86 (1W) 87 (0.8W) 91 (0.5W) 106 (0.4W) (a) (b) 圖 10. 設計規則檢驗後的最後佈置，：（一）PowerPC 603 的和（二）PowerPC 604 的。對於在圖 8（a）、（b）和 10（a），（b）佈置的 Tmax , Tmin , Tav , Tmax 和 S 總結在表四。如同顯示於表四，在 PowerPC 603 的例子， TFPA 得到的結果比原先的設計稍佳，系統故障率改進了約 15％。對於 PowerPC 604 的案例，由 TFPA 得到的佈置比原先的設計俱備更低的 Tmax 和 Tmax 值。因此，由 TFPA 得到的佈置 Tav 和 S 值也低於原先的結果。系統故障率約改善 8％。眾所周知，傳統 FDA [23]生成的初始佈局通常有嚴重的元件重疊現象，因為傳統的力模型不包括基板的幾何信息。相比之下，基板的幾何信息隱含在 TFPA 的熱斥力模型中; 因此，重疊的問題，可以大大縮減。 Table 4. 比較由 TFPA 得到的佈置與在[31]的佈置 PowerPC 603 PowerPC 604 Cases Original TFPA Original TFPA Tmax(℃) 94 94 180 179 Tmin(℃) 59 58 83 85 Tmax =Tmax-Tmin 35 36 97 94 Tav(℃) 72.5 71.7 102.1 101.1 S (Fit) 4445 3788 659875 605712 四、結論基於類比熱傳導理論得到的熱力佈局算法（TFPA），被應用於求解 MCM 的熱佈置問題。TFPA 被證明是有效率和有效的算法。TFPA 的空間和時間的複雜度分別是 O  m  和 TCPT-2002-019.R1 12 O  m 2  。在 TFPA，晶片被持續的朝向較低溫度的地區移動。因此，可以一個較低溫而且溫度分佈均勻的佈置。 TFPA 測試過三種不同類型晶片的的八個的例子。對於均勻晶片類型，TFPA 得到可靠性最佳的佈置；對於晶片大小相同但功率不同的類型，TFPA 跟相比較的方法得到更均勻溫度分佈的佈置；對於不均勻晶片類型，TFPA 較目前的消費產品（PowerPC 603 和 604）有更好的系統可靠性的佈置。附錄從第二節（8）給予淨熱力由 d j 施加在 di 如同  Fz i, j  fz i, j   Pz (a) a 1 (8)   fz i, j   Pzc (a)  Pzr (a) a 1 a   其中 Pzc (a)   fz i,( j a,  c)  fz i,(a,jc) ca 和 a 1  , Pzr (a)   fz i,(r,ja)  fz i,( j r,  a) r   a 1  Pz  a   Pzc  a   Pzr  a  奇中 z 是 x 或 y 。  本節討論在公式（8）中忽略  Pz (a ) 的截斷誤差。在以下的討論中，因為在 y 方向 a 6 的推導與在 x 方向的推導相同，所以只有在 x 方向的推導被考慮。為了方便，考慮基板為正方形，並令 di 位於中心點。因此 0  L,W  1, xi  0.5 及 yi  0.5 。在 di 與 d j r ,c  之間的距離差可以表為 xi(,rj,c )  c  x (c ) (17a) yi(,rj,c )  r  y ( a ) (17b) 和其中  x c   1  x j  xi  和  y r    1  y j  yi  。顯然  x c   0.5,  y  r   0.5 。 c di 與 di, j  a , c  r r 之間的距離的平方和可以描述為   x (  a,c) 2 i, j   y (  a,c) 2 i, j    c  x   a  y  x   y    cx  (a,c) 2 i, j  ay ( a )  a 2  c 2 1  2 a2  c2   因為  x   y  (c) 2 (a) 2 a c 2 2 方程式（18）可以近似為 r   a (  a, c ) 2 i, j TCPT-2002-019.R1 2  (c) 2 (c) (c) 2 a2  c2 (a) 2 (a) 2 (18)  1 1  2  0.014  1 as a  6 2 2 a c 2a  2    c 2 1  2h1  h2  as a  6 13 (19a) 其中 h1  ay ( a ) cx ( c ) and . h  2 a2  c2 a2  c2 同樣地，我們可以得到 r   a ( a ,c ) 2 i, j 2   c 2 1  2h1  h2  as a  6 (19b) A. Pxc  a  的推導根據（5），我們發現  x (  a ,  c ) xi(,aj,c )  i, j  fx i,( j a,  c)  fx i,(a,jc)   i q j   3 ( a ,c ) 3  ri(, j a ,  c )   r i, j      (20)  Substituting (17a), (17b), (19a) and (19b) into (20), yield (21) 將（17a），（17b），（19a）和（19b）代入（20），得到（21）    i q j   c  x ( c ) c  x ( c ) fx i,( j a,  c)  fx i,(a,jc)     3 / 2 3 / 2 3 / 2 1  2h1  h2   a2  c2  1  2h1  h2        3/ 2 3/ 2 (c) (c)    c  x 1  2h1  h2   c  x 1  2h1  h2       2 2 3/ 2 2 3/ 2 a c     1  4 h  h 1 2   通過應用泰勒級數展開   iq j    1  2h1  h2 3 / 2  1  3h1  h2   3 h1  h2 2     (22) 2 和 1  4h  h   2 3/ 2 1 2 （21）  1  6h1  h2   ... 2 (23) 根據以下分析，在（22）和（23）中的高階項可以合理忽視。 (c) (a)  3 h1  h2 2  3  cx 2  a2 y 2 2 a c 和 2 2  3 a  c  3 1 2    0.015  1 as a  6    2   2  8a c  8  2a   2 6h1  h2   0.06  1 as a  6 2 因此，（22）和（23）可以近似為 1  2h1  h2 3 / 2  1  3h1  h2  as a  6 和 1  4h  h   2 3/ 2 1 2 將（24）和（25）插入（21），我們得到 fx (  a,  c) i, j  fx (a, c) i, j   1 as a  6  (25)    i q j 2x ( c )  6ch1  h2  a 由 c  a 到 c  a 將（26）這一系列式子加起來 TCPT-2002-019.R1 (24) 14 2 c  2 3/ 2 (26) Pxc (a )  a      i q j 2x ( c )  6ch1  h2  c a a 2  c2  3/ 2 (0) a   2x ( c )  6ch1  h2  2x ( c )  6ch1  h2     2x    i q j  3      3/ 2 3/ 2 2 2 2 2 c 1  a c a c      a      (27) a  2x ( 0 ) 4x ( c )  12ch2    i q j  3   3/ 2  c 1 a2  c2  a    a  2x ( 0 ) a 2  2c 2    i q j  3  4   x ( c )  5/ 2  c 1 a2  c2  a    B. Pxr  a  的推導 Pxr  a  可以描述為 Pxr (a)   fx a r  a (  r ,  a) i, j    fx i,(r,ja)  fx i,( j a,  a)  fx i,( j a,a)  fx i,(a,j  a)  fx i,(a,ja)  (28) 如同導出的 Pxc  a  同樣的方法，（28）的右邊第一項為  fx a r  a (  r,  a) i, j  fx (r, a) i, j  a  2x ( 0) a 2  2r 2  (r )   i q j  3  4   x  5/ 2  r 1 a2  r 2  a   (29)  估計（28）右邊第二項 fx i,( j a,  a)  fx i,( j a,a)  fx i,(a,j  a)  fx i,(a,j a)  x (  a ,  a ) x i(,ja , a ) x i(,aj,  a ) x i(,aj, a )  i, j    i q j     (  a,a ) 3 (a,a) 3 ( a,a ) 3   ri(, j a ,  a ) 3  r  r  r i , j i , j i , j      i q j   a  x ( a ) a  x ( a )  a  x ( a ) a  x ( a )     3 x ( a )  y ( a ) 3 x ( a )  y ( a ) 3 x ( a )  y ( a ) 3 x ( a )  y ( a ) 2 2a 3  1  1  1  1   2 a 2 a 2 a 2 a        iq j   x ( a )  3y ( a )   2 2a 3  9  x ( a )  y ( a ) 1     4  a  (a)  i q j x  as a  6 2a 3      2     x ( a )  3y ( a )  1 9  x ( a )  y ( a )  4  a    2        (30) 將（29）和（30）代入（28），我們發現 a  2x ( 0) x ( a ) x ( r )  a 2  2r 2 Pxr (a)   i q j  3   4   5/ 2 2a 3 r 1 a2  r 2  a  C.   a 6  Pz  a  / fxi , j 的推導 TCPT-2002-019.R1       15     as a  6 (31) 將（27）和（31）代入（8），得到 a  4x ( 0) x ( a ) x ( c )  a 2  2c 2 Px (a)   i q j  3   8   5/ 2 2a 3 c 1 a2  c2  a      as a  6 (32) 顯然，上述系列是絕對收斂。利用 Matlab 將 Px  a  從 a  6 到 1000 加起來，得   Px (a)  0.0043 i q j x ( 0) (33) a 6 除以 fxi , j 得   Pz (a) a 6 fx i, j  0.0043 i q j x ( 0)  iq j  x ( 0)  0.0043ri , j  3 (34) r  3 i, j 因為 r   0.5 3 i, j 2  0.5 2  3/ 2  0.3536 則   Pz ( a ) a 6 fx i, j  0.0015 (35)  因此，可以得出結論為：與 fxi , j 比較，忽視  Pz  a  的截斷誤差只有小於 0.15％的相對 a 6 誤差。 ACKNOWLEDGMENT This work was supported by the National Science Council, Republic of China under contract no. NSC 89-2215-E-218-013. I am pleased to thank Professor Jung-Hua Chou for his valuable comments and suggestions concerning this paper. 致謝作者感謝 J.-H.Chou 博士，就這一文件作出了寶貴的意見和建議。 REFERENCES 1. M. Pecht, Integrated Circuit, Hybrid, and Multichip Module Package Design Guidelines – A Focus on Reliability, New York: Wiley, 1994. 2. E. Suhir, “Thermal stress failures in microelectronic components – review and extension,” in Advances in Thermal Modeling of Electronic Components and System, A. Bar-Cohen and A. D. Kraus, ed., New York: Hemisphere Publishing Corporation, 1988, pp.337-412. TCPT-2002-019.R1 16 3. N. Sherwani, Algorithms for VLSI Physical Design Automation, 3rd ed. Boston: Kluwer Academic Publishing, 1999. 4. G. Wippler, M. Wiesal, and D. Mlynski, “A combined force and cut algorithm for hierarchical VLSI layout,” in Proc. 22th Design Automation Conf., 1982, pp. 671-677. 5. W. Maly and A. P. Piotrowski, "Heat exchange optimization technique for high-power hybrid IC's", IEEE Trans. Comp, Hybrids, Manufact. Technol., vol. 2, no. 2, pp. 226-231, 1979. 6. A. H. Mayer, "Computer-aided thermal design of avionics for optimum reliability and minimum life cycle cost," Technical Report AFFDL-TR-78-48, Air Force Flight Dynamics Laboratory, 1978. 7. M. Pecht and J. Naft, "Thermal reliability management in PCB design," in Proc. 1987 Ann. Reliability and Maintainability Symp., 1987, pp. 27-29. 8. D. Dancer and M. Pecht, "Reliability optimization technique for convectively electronics," IEEE Trans. on Reliability, vol. 38, no. 2, pp. 199-205, 1989. 9. M. Osterman and M. Pecht, “Component placement for reliability on conductivity cooled printed wiring boards,” Trans. of the ASME Journal of Electronic Packaging, vol. 111, pp. 149-156, 1989. 10. R. Eliasi, T. Elperin, and A. Bar-Cohen, "Monte Carlo thermal optimization of populated printed circuit board," IEEE Trans. Comp, Hybrids, Manufact. Technol., vol. 13, no. 4, pp. 953-960, 1990. 11. M. D. Osterman, "A physics of failure approach to component placement," Trans. of the ASME Journal of Electronic Packaging, vol. 114, pp. 305-309, 1992. 12. C. N. Chu and D. F. Wong, “A matrix synthesis approach to thermal placement," IEEE Trans. Computer-Aided Design, vol. 17, no. 11, pp. 1166-1174, 1998. 13. C.-H. Tsai and S.-M. Kang, “Cell-level placement for improving substrate thermal distribution,” IEEE Trans. Computer-Aided Design, vol. 19, no. 2, pp. 253-266, 2000. 14. K. Y. Chao and D. F. Wong, “Thermal placement for high-performance multi-chip modules," International Conf. on Computer Design, Austin, Texas, 1995, pp. 218 - 223. 15. M. C. Tang and J. D. Carothers, “Consideration of thermal constraints during multichip module placement,” Electronic Letters, vol. 33, no. 12, pp. 1043-1045, 1997. 16. Y.-J. Huang and S.-L. Fu, “Thermal placement design for MCM applications,” Trans. of TCPT-2002-019.R1 17 the ASME Journal of Electronic Packaging, vol. 122, pp. 115-120, 2000. 17. C. Beebe, J. D. Carothers, and A. Ortega, “MCM placement using a realistic thermal model,” Proceeding of the Tenth Great Lakes Symposium on VLSI, pp. 189-192, 2000. 18. J. Lee, J. H. Chou, and S. L. Fu, "Reliability and wireability optimizations for module placement on convectively cooled printed wiring board," INTEGRATION, the VLSI Journal, vol. 18, no. 2&3, pp. 173-186, 1995. 19. M. D. Osterman and M. Pecht, "Placement for reliability and routability of convectively cooled PWB's," IEEE Trans. on Computer-Aided Design, vol. 9, no. 7, pp. 734-744, 1990. 20. N. V. Queipo, J. A. C. Humphrey, and A. Ortega, “Multiobjective optimal placement of convectively cooled electronic components on printed wiring boards,” IEEE Trans. Comp., Packag., Manufact. Technol., A, vol. 21, no. 1, pp. 142-153, 1998. 21. N. V., Queipo and G. F. Gil, “Multiobjective optimal placement of convectively and conductively cooled electronic components on printed wiring boards,” Trans. of the ASME Journal of Electronic Packaging, vol. 122, pp. 152-159, 2000. 22. J. Lee and J. H. Chou, "Hierarchical placement for power hybrid circuits under reliability and wireability constraints," IEEE Trans. on Reliability, vol. 45, no. 2, pp. 200-207, 1996. 23. N. Quinn and M. Breuer, “A forced directed component placement procedure for printed circuit boards,” IEEE Trans. Circuits Syst., vol. 26, no. 6, pp. 377-388, 1979. 24. F. Mo, A. Tabbara, and R. K. Brayton, “A force-directed macro-cell placer,” in Intl. Conf. on Computer-Aided Design, 2000, pp. 177-180. 25. R. M. Karp, “Reducibility among combinatorial problems,” in Complexity of Computer Computations, R. E. Miller and J. W. Thatcher, Ed., New York: Plenum, 1972. 26. D. J. Dean, Thermal design of electronic circuit boards and packages, Scotland: Electrochemical Publications Ltd., 1985. 27. A. L. Palisoc and C. C. Lee, “Exact thermal representation of multilayer rectangular structures by infinite plate structures using the method of images,” Journal Appl. Phys. vol. 12, no. 64, pp. 6851-6857, 1988. 28. Y.-K. Cheng and S.-M. Kang, “A temperature-aware simulation environment for reliable ULSI chip design,” IEEE Trans. Computer-Aided Design, vol. 19, no. 10, pp.1211-1220, 2000. 29. G. N. Ellison, Thermal Computations for Electronic Equipment, New York: Van Nostrand TCPT-2002-019.R1 18 Reinhold Co., 1983. 30. G. E. Ellison, “Thermal analysis of circuit boards and microelectronic components using an analytical solution to the heat conduction equation,” Twelfth IEEE SEMI-THERM Symposium, 1996, pp. 144-150. 31. T. D. Yuan, “Thermal management in PowerPC microprocessor multichip modules applications,” Thirteenth IEEE SEMI-THERM Symposium, 1997, pp. 247-256. TCPT-2002-019.R1 19

基於熱傳導理論的熱佈局演算法

Products

Support

基於熱傳導理論的熱佈局演算法

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib