半导体组件是汽车中的电子产品总成的核心, 按照汽车制造厂商和型号的不同, 现代的汽车可能需要多达8,000个芯片, 并且这个数字只会随着自主驾驶汽车的普及而增加, 额外的电子子系统及其所采用的集成电路将为无人驾驶汽车提供其所需的传感器, 雷达和人工智能.
汽车和轻型卡车的年产量是8,800多万辆, 每辆车中安装数千个芯片产品, 汽车行业对半导体制造业的影响已经开始显现. 一个简单的事实就是汽车里所采用的数千个芯片都不可以失灵.
汽车半导体零件的可靠性至关重要, 任何在车辆行驶过程中出现故障的芯片都可能导致昂贵的保修维修和产品召回, 并且可能会损坏汽车制造商的品牌形象, 在极端情况下可能会导致人身伤害甚至危及生命.
如果一辆普通汽车中有5,000个芯片, 汽车制造商每天生产2.5万辆汽车, 那么即使是百万分之一(ppm)的芯片故障率也会导致每天超过125辆汽车因为芯片质量出现可靠性问题.
由于半导体是汽车制造商故障排列图中的首要问题, 一级的汽车系统供货商现在要求半导体质量可以达到十亿分之一(ppb)的级别, 并且目前的趋势是无论芯片数量多少, 越来越多的供货商开始限定 '最多允许的故障数目' .
目前发现可靠性故障的方法过度依赖于测试和老化试验, 结果是质量目标无法实现并且相去甚远. 同时, 审计标准越来越具有挑战性, 推动晶圆厂在芯片制造的源头就发现这些可靠性问题, 因为这时发现问题并采取纠正措施的成本最为低廉. 要进入这个不断增长的市场领域, 或者简单地保持市场占有率, 集成电路制造商必须积极应对这种对于芯片可靠性要求的变化.
幸运的是, 对于半导体制造商来说, 芯片的可靠性与他们所熟知的东西高度相关: 随机缺陷.
事实上, 对于设计良好的制程和产品而言, 早期的芯片可靠性问题(外在可靠性)以随机缺陷为主. 杀手缺陷(影响良率的缺陷)是导致组件在时间t=0(最终测试)失败的缺陷. 潜在的缺陷(影响芯片可靠性的缺陷)是导致组件在t﹥0(在老化之后)发生故障的缺陷.
发现杀手缺陷(良率)与潜在缺陷(可靠性)之间的关系是通过观察到影响良率的同一缺陷类型也影响可靠性. 这两者主要根据缺陷的大小以及它们在组件结构上出现的位置来区分. 图1显示了导致开路和短路的杀手和潜在缺陷的例子.
图1 影响良率的同一缺陷类型也会影响可靠性. 主要根据缺陷的大小以及它们在图案结构上的位置来区分.
良率和可靠性缺陷之间的关系并不局限于一些特定的缺陷类型; 任何可能导致良率损失的缺陷类型也可能导致可靠性问题. 故障分析表明, 事实上大多数可靠性缺陷是制程相关的缺陷, 并可溯源到晶圆厂. 由于良率和可靠性缺陷具有相同的根本原因, 因此提高良率(通过减少与良率相关的缺陷)将会提高可靠性.
图2中的A曲线显示了典型的良率曲线. 如果我们只考虑芯片良率, 那么在某个时候, 在这个制程中进一步的投资可能不具备成本效益, 因此随着时间的推移良率趋于平稳. 图2中的B虚线显示了制造相同产品的同一工厂的曲线. 但是, 如果他们想要为汽车行业供货, 那么他们也必须考虑到可靠性不足的成本. 在这种情况下, 需要进一步的投资来进一步降低缺陷密度, 这既能提高良率, 又能提升汽车供货商所需的可靠性.
图2 不同类型晶圆厂的收益率曲线(收益率相对于时间). A曲线适用于非汽车工业的晶圆厂, 主要考虑的是晶圆厂的盈利能力. 在某一时刻, 收益率已经足够高, 继续试图减低缺陷率并不实际. B虚线也是包括了可靠性的收益率曲线. 对于汽车供应链中使用的集成电路产品, 必须进行额外的投资, 以确保高可靠性, 这与收益密切相关.
由普通级芯片供货商转型成为汽车供货商需要晶圆厂管理层面的模式转变. 成功的汽车行业半导体制造商早已采取以下策略: 降低潜在(可靠性)缺陷的最佳方法是降低晶圆厂的总体随机缺陷水平. 这意味着要有一个世界一流的减低缺陷的策略, 包括: 基线良率提升, 减低异常发生率, 出现异常时能迅速发现并在线修复, 以及使用晶粒筛选剔除可疑的晶粒.