在UPS电源供电系统中,我们常用平均无故障工作时间(MTBF)来评价UPS电源的可靠性。它代表的物理含义是:从UPS电源投入运行起,直到因UPS电源供电系统中的某个关键器件"出故障",并***终导致在其输出端出现"停电"故障时为止的平均工作时间。显而易见, UPS电源的MTBF值越大越好。其大小不仅受控于UPS电源中的各种元件和部件的失效率(λ),还受控于UPS电源设计方案和制备工艺。这就意味着:即使UPS电源厂家釆用的是相同的元器件。然而,由于设计方案和制造工艺的不同、也会导致不同的UPS电源具有不同的失效率(λ)的情况发生。
平均无故障工作时间(MTBF)与失效率(λ)之间的关系为:
MTBF=1/λ
如图1所示,在***常用和***可靠的带"输出隔离变压器"的双变換、在线式UPS电源中、有如下3条供电通道:
逆变器供电通道:由输入交流电源、整流器(电池)、逆变器、输出隔离变压器、输出静态开关/断路器开关等所组成的UPS电源逆变器供电通道;
交流旁路供电通道:由输入交流电源和旁路"静态开关"等所组成的UPS电源交流旁路供电通道
维修旁路供电通道:由输入交流电源和手动维修旁路开关所组成的UPS电源维修旁路供电通道。
因此,对于1台UPS电源单机电源来说,它有两个平均无故障工作时间(MTBF)值:
(a) UPS电源逆变器的MTBFI: 它代表当UPS电源被置于"不帶交流旁路"工作状态下运行时,从UPS电源投入正常工作时起、到因故致使UPS电源的逆变器进入"自动关机",并造成UPS电源输出"停电"时的平均无故障工作时间。
从某种意义上讲、对于不允许出现"网络瘫痪"故障的关键性网络来说(例如:***的电子政务和军事网控系统、电信企业的收费系统、石化和IC生产线、***的交易和营业系统、交通管理和售票系统等), 是不允许它们所用的UPS电源进入"交流旁路(包括交流静态旁路和维修旁路)"工作状态的。这是因为:在此条件下,一旦在不输入电源出现过"瞬间供电中断"时间超过20毫秒以上的"闪断"故障时、就会造成"网络瘫痪"故障的发生。因此,对于信息网络时代的UPS电源而言,这个MTBFI参数是判断UPS电源选型是否合理的***重要的指标之一。
(b) UPS电源单机的MTBF(它意味着:此时的UPS电源是运行在"帶交流旁路"的工作状态下): 它表示在UPS电源因故进入"逆变器自动关机"状态时、并被自动切換到交流旁路工作状态后,又遇到输入电源因故出现"停电"事故或因旁路"静态开关"失效而导致UPS电源进入"输出停电"故障的平均无故障工作时间。显然,这个MTBF值大小不仅与UPS电源的质量高低有关,还与市电电网的"停电几率"密切相关。
对于那些能容忍出现"网络瘫痪"故障的用户来说, 当出现因UPS电源输出停电而导致出现"网络瘫痪"故障时,一般它仅会给用户带来"时间的浪费"和工作效率的下降。它既不会给用户带来巨大的经济损失、也不会造成社会生活的局部混乱(例如:供学生練习用的网络、个人浏览用的PC机平台等)。也就是说,仅对"非关键性"的信息网络用户来说、才宜于把这个UPS电源单机的MTBF参数、作为判断UPS电源的选型是否合理/产品质量高低的技术指标來使用。
对于UPS电源逆变器电源来说,它的总失效率λ逆变器应该是位于逆变器电源供电通道内所有元器件的失效率之和:
λ逆变器=∑λS(i)* A(i);
式中:λS(i)是第i个元器件的失效率; A(i)是:因第i个元器件"出故障"而可能导致UPS电源逆变器"自动关机",并转入"交流旁路供电状态"的几率;它意味着:并非位于逆变器供电通道中的仼何部件"出故障"都一定会导致产生"逆变器自动关机"的故障的。
1台UPS电源单机的失效率λ的数字仿真和计算分析流程图被示于图 2中。
如该图所示,UPS电源的MTBF=1/λ受控于逆变器逻辑控制PC板、整流器逻辑控制PC板、静态开关逻辑控制PC板、逆变器驅动模块、直流辅助电源、风扇等部件的失效率。在这里需说明的是:在UPS电源中、並非在仼何元件"发生"失效"故障时、都一定会导致UPS电源的故障率增大。例如:为确保位于UPS电源中的各种控制电路都能获得具有高"容错"功能的直流辅助电源供应,在***UPS电源中、常釆用由UPS电源的交流输入电源及逆变器输出的交流电源所构成的多路AC/DC变換式直流电源和由蓄电池所产生DC/DC变換式直流电源所共同组成的冗余式直流辅助电源设计方案。显然,对于这种UPS电源来说,只有在上述AC/DC及DC/DC变換式直流电源同时"出故障"时、才会造成直流辅助电源的"消失"。因此,从计算程序上、它具有类似"与门"的逻辑关係。因此,在分析UPS电源的失效率时,不宜简单地釆用总失效率=各元部件的失效率的"叠加和"或失效率的"乘积"的计算办法。
为说明此问题,现以UPS电源逆变器电源的平均无故障工作时间MTBFI为例来说明此问题:有关逆变器模块中的部份"控制元件"的失效率及其影响统计值被列于表1中。从该表可见:
在UPS电源逆变器供电通道中、故障率***高的部件是:IBGT功率模块、IGBT管的驱动电路及微处理器/DSP芯片。在UPS电源逆变器电源的总失效率中、其中52.3%的故障是由IGBT管的驱动电路+ IBGT功率模块的"失效"所造成的、10.8%的故障来自微处理器/DSP芯片的失效/误动作。从这样的统计数据可见:当我们在设计和选用UPS电源时、提高UPS电源可靠性的***大潜力到底在何处?
当位于逆变器供电通道中的微处理器、旁路接口、UPS电源输出检测、DC总线电压检测、直流辅助电源、三相负反馈调控电路、IGBT模块等关键部件发生故障时,它们的确会导致UPS电源逆变器"自动关机"、并转入交流旁路供电状态,从而造成UPS电源的MTBFI值的下降。然而,在逆变器供电通道中、当遇到"退耦电容"失效、DC总线电流检测、交流旁路电压检测电路等"出故障"时,虽然它有可能会导致UPS电源发出报警信号、但并不会导致UPS电源进入交流旁路供电状态。当然,也不会造成UPS电源产生输出"停电"的故障。
从图1和2可见:位于UPS电源供电通道中的各部件、并非都处于"串联"工作状态。对于UPS电源的逆变器供电通道与交流旁路供电通道来说,由于它们是处于"并联"工作状态的。因此,只有在逆变器"自动关机"/逆变器的输出静态开关"失效"、输入电源停电/交流旁路静态开关"失效"等故障同时出现时、才有可能造成UPS电源输出停电。因此,UPS电源单机的可靠性(MTFB值)必然是高于UPS电源逆变器的可靠性(MTBFI值)。
表1: 逆变器供电通道中的部份"控制元件"的失效率及其影响
下面举例说明,目前的大型UPS电源的MTBF值所能达到的水平:
UPS电源逆变器的平均无故障工作时间(MTBFI)=48,200小时;
UPS电源单机的平均无故障工作时间(MTBF)=383,400小时(注:市电电网的MTBF是按1000小时来计算的)。
"1+1"型冗余并机系统的MTBF=2,315,100小时。
由上式可见:
(a)***能反映UPS电源可靠性的指标应该是逆变器电源的MTBFI值,而不是带"帶交流旁路"的UPS电源单机的MTBF值。这是因为在UPS电源单机的MTBF值的计算中,即使它们的逆变器具有相同的MTBF值,也会因所采用的市电电网MTBF值和UPS电源的平均修复时间的不同而使得同样的一台UPS电源单机的实际MTBF值相差较大,从而削弱了各种UPS电源单机的MTBF值的"可比较性"。
(b) 采用"N+1"型冗余并机配置设计方案后,可以大大提高UPS电源供电系统的MTBF值。大量的运行实践证明:这的确是提高UPS电源冗余供电系统"可靠性"的行之有效的技术手段。
此外,大量的UPS电源运行实践表明:所选用的UPS电源单机的额定输出功率越大,它的可靠性也越高(MTFB值越大)。UPS电源单机的额定输出功率越大,每KVA的平均价格也越低、配电系统所用的电缆数量越少。因此,当我们在规划、设计IDC机房/电信机房时,应尽可能地选用单台大容量UPS电源和釆用集中供电设计方案。这是因为它具有较好的性价比的缘故。
o 0.7--10 kVA UPS电源的MTBF=4--10万小时;
o 15--40 KVA UPS电源的MTBF=9--22万小时;
o 50--1000 KVA UPS电源的MTBF=20--40万小时。