半導體IC的良率與可靠性之間的緊密聯繫已經得到充分的研究和記錄. 圖1中的數據展示了這種關係. 類似的結果在批次, 晶圓和晶片級別上都可以看得到. 簡而言之, 良率高, 可靠性隨之也好. 這種良率與可靠性的相關性完全在意料之中, 因為導致晶片故障的缺陷類型與造成早期可靠性問題的缺陷類型是相同的. 影響良率和可靠性的缺陷之間的區別主要在於它們的尺寸和它們在晶片圖案上的位置.
圖1 IC組件的可靠性與良率之間緊密相關性.
因此, 減少IC生產製程中影響良率的缺陷數量將會提高基準良率, 同時可以提高實際使用中的組件可靠性. 認識到這一事實, 服務於汽車市場的代工廠就面對兩個關鍵的問題. 首先是經濟問題: 為了提高可靠性, 需要投入時間, 金錢和資源以提高良率, 投入的適當程度為何? 第二個問題是技術問題: 為了將基準良率提高到必要水平, 什麼是減少缺陷的最佳方法?
對於製造消費者電子設備的代工廠(行動電話, 平板計算機等IC), 「成熟良率」被定義為進一步投入時間和資源卻並不一定會提高良率的轉折點. 隨著產品成熟, 良率趨於穩定, 通常會達到一個高位數值但仍遠低於100%. 消費類產品代工廠會將資源重新分配到開發下一個設計節點的製程和設備, 或降低成本以提高其成熟節點的獲利能力, 而不是追求更高的良率, 因為這樣做更有經濟效益.
對於汽車代工廠而言, 是否為了提高良率而增加投資的經濟決策已經超出了典型的邊際收益的決定. 當可靠性問題出現的時候, 汽車IC製造商可能須要承擔昂貴且耗時的故障分析, 並且在產品的保固期內承擔故障和產品回收的經濟責任, 以及潛在的法律責任. 考慮到對汽車IC可靠性的要求比消費性IC要高兩至三個數量級, 汽車代工廠必須達到更高的基準良率水平. 這就須要重新思考「成熟良率」的含義.
圖2著重展示了消費性產品與汽車代工廠商的成熟良率之間的差異. 任何類型的晶圓廠都會提高良率曲線, 因而幾乎所有系統性影響良率的根源都已經被解決. 剩餘的良率損失主要是來自於製程設備或環境的隨機缺陷所造成的. 這時, 消費產品代工廠可能認為良率和可靠性「足夠好」並採取相應的方法. 然而, 在汽車行業, 代工廠採用持續改進的策略來推高良率曲線. 透過降低影響良率的缺陷發生率, 汽車代工廠還可以降低潛在的可靠性缺陷, 從而優化其利潤並降低風險.
汽車供應鏈(從OEMs到一級供貨商, 再到IC製造商)都正在形成一種「每個缺陷都很重要」的思維模式和追求零缺陷的戰略. 他們認識到, 當潛在缺陷離開代工廠之後, 它在供應鏈中每向前一級, 發現和解決的成本都會增加10倍. 因此, 目前過度依賴電性測試的方法需要被成本最低的策略所取代, 即將潛在故障在代工廠攔下. 只有有條不紊的實施減少缺陷的計劃, 代工廠才能實現零缺陷目標, 並能夠通過汽車製造商嚴格的審核.
除了穩健的線上缺陷控制能力之外, 汽車採購經理希望看到的一些減少缺陷的方法還包括:
. 持續改進計劃(CIP), 用於減少基準缺陷
. 最佳設備工作流程
. 不良設備改善計劃
持續減少基準缺陷
產線缺陷策略是任何嚴格降低基準缺陷計劃的基礎. 為了成功檢測出影響其設計規則和組件類型的良率和可靠性缺陷, 代工廠的產線缺陷策略必須包括合適的製程控制設備和合適的檢測取樣計劃. 所採用的缺陷檢測系統必須具備所需的缺陷靈敏度, 維護良好並且達到規格, 以及使用精心調整的檢測程序. 檢測取樣必須針對製程步驟達到足夠的頻率, 以快速檢測到製程或設備的偏移. 此外, 應有足夠的檢測產能用以支援加速異常偵測, 根本原因區分和風險WIP追蹤之控制計劃. 有了這些要素, 汽車代工廠應該可以實現成功的基準缺陷降低計劃, 該計劃能夠證明隨著時間的推移良率趨勢的提升, 提供進一步改進的目標以及等同於業界最佳做法.
在一個基準缺陷減少計劃中, 最大的挑戰之一就是回答: 這個缺陷來自哪裡? 答案往往不那麼簡單. 有時, 缺陷產生之後經過多個製程步驟才被檢測到. 有時, 只有在晶圓經過其他製程並「裝飾」缺陷之後, 它才會變得明顯, 也就是說讓缺陷在檢測系統中更為顯而易見. 設備監控策略有助於解決缺陷起源的問題.
在設備監控/設備認證(TMTQ)的應用中, 先檢測一片控片晶圓, 使其在指定的製程設備(或反應室)中運行, 然後再次檢測(圖3). 第二次檢測發現的任何新的缺陷必定是由於該指定的製程設備而產生的. 結果很明確; 對缺陷的根源沒有任何疑問. 追求零缺陷標準的汽車代工廠認識到設備監控策略的好處: 透過靈敏的檢測程序, 適當的控制限值和失控行動計劃(OCAP), 可以揭示源自每個製程設備的隨機良率損失並將其解決.
圖3 在「預檢」檢測取得控片晶圓的基準數據之後, 可以採用該晶圓迴圈運行部分或全部製程設備步驟. 「後」檢測揭示了製程設備所添加的缺陷.
此外, 如圖4所示, 將製程設備新增加的缺陷按照時間的推移進行繪製, 這提供了可持續改進的記錄, 可以對其進行審計並用於設定未來的缺陷減少目標. 代工廠可以將每個設備上出現的缺陷分類, 並生成資料庫, 並可作為現場故障的失效分析時的參考. 這種方法需要非常頻繁的設備認證(至少每天一次)通常與下面討論的最佳設備工作流程或不良設備改善計劃一起使用.
圖4 隨著時間的推移持續改進設備的清潔度. 問題的根源是明確的, 可以客觀地按季或按月設定缺陷減少目標. 另外, 比較兩種製程設備的缺陷可以顯示哪種機台更清潔. 這有助於指導設備維護活動, 並鎖定設備之間產生差異的原因.
AWF/不良設備改善計劃各有優勢
最佳設備工作流程是代工廠用於達到汽車行業要求的零缺陷標準的另一種策略. 藉助最佳設備工作流程或汽車工作流程(AWF), 用於汽車IC的晶圓只在晶圓廠的最佳製程設備中運行. 這要求晶圓廠了解任何既定製程步驟的最佳機台. 為了可靠地確定哪種機台最好, 代工廠利用線上和設備監控檢測的數據, 然後僅將這些機台用於汽車工作流程. 將汽車晶圓在每個製程步驟限制在單一的設備上可能會導致更長的周期時間. 然而, 與可能導致可靠性問題的缺陷率較高的製程流程相比, 這種做法對於汽車晶圓還是更受青睞. 加上有條不紊的持續改進計劃, 大多數代工廠通常可以通過設定季度缺陷減低的目標, 在每一步製程中獲得多個符合AWF要求的設備.
由於這種方法難以擴展, 因此最佳設備工作流程最適合只有小部分WIP為汽車的代工廠. 對於大批量生產汽車產品的代工廠, 應優先考慮採用更有條理的持續改進計劃, 如下文所述的不良設備改善的方法.
不良設備改善計劃與最佳設備的工作流程相反, 因為它可以在任何給定的製程步驟中主動解決最差的製程設備. 在降低基準缺陷方面取得最大成功的代工廠往往通過採用不良設備改善計劃. 他們首先在每個製程步驟中將最差設備下線, 並調整該設備, 直到它超過同組中其餘設備的平均值. 他們一遍又一遍地重複這個過程, 直到同組的所有設備都符合最低標準. 一個有效的不良設備改善計劃要求工廠有一個井然有序的設備監控策略, 以在每一個步驟對每台製程設備進行認證. 至少每台設備上每天完成都需要完成一次認證程序, 以確保採集足夠的數據, 讓ANOVA或Kruskal-Wallis分析確定每組中最好和最差的設備. 一個不良設備改善計劃會安排製程設備的停機時間, 並且是眾所周知的將整個晶圓廠提升至汽車標準的最快的方法之一. 通過提高良率和可靠性, 該策略最終提高了汽車代工廠的有效產能和盈利能力.