奥普森UPS
奥普森UPS报价
奥普森UPS官网

权衡N+1冗余UPS不间断电源配置之间的成本、部署速度与可靠性

权衡N+1冗余UPS配置之间的成本、部署速度与可靠性#不间断电源ups#

摘要:

随着通过软件实现IT 容错的持续改进,越来越多的数据中心倾向于采用N+1 冗余的UPS 架构,而非2N 架构。一般而言,实现N+1 冗余配置的常见方式有两种:将多个单一UPS 并机或部署一个包含多个内部模块的UPS 主机,以实现N+1 冗余。在本文中,我们对内部“模块化”冗余UPS 和并机冗余UPS 之间的主要权衡项进行了量化,得出部署内部“模块化”冗余时,其投资成本节省了27%,同时可缩短1 至2周的部署时间。此外,我们还讨论了容错在UPS 内的重要性,以确保满足可用性、可靠性和可维护性的需求。

简介:

数据中心会根据其所支持负载的关键性,采用不同的冗余等级。双路架构(例如,两个的电源路径)能够确保最高等级的可用性,在任一系统进行维护或发生故障时亦无需停用负载。

而在当今的数据中心中,我们会发现在IT 层面通过软件实现容错的情况越来越多。随着虚拟化和超融合等技术的出现,服务器宕机不再意味着IT 任务随之中断。如果一台物理服务器由于上游故障而出现宕机,或按计划进行停机维护,那么数据中心能够将业务功能迁移到另一台服务器、另一个IT 区域、另一间IT 机房或另一个完全的数据中心。

虽然可用性仍是数据中心的一个关键目标,但我们发现,借助对关键物理基础设施(如UPS)部署N+1 冗余,也可以保证其可用性目标。在本白皮书中,我们将阐明实现UPS 系统N+1 冗余的不同方法,并量化其投资成本、部署时间、效率和可靠性的权衡项,同时,我们还将讨论UPS 内部容错的重要性,以确保满足可靠性、可用性和可维护性的需求。

术语说明

在有关数据中心的多种讨论场合,“N+1”一词可能用来指代多种UPS 配置。以下的关键术语定义旨在阐明三个特定“N+1”配置之间的区别。

N+1 冗余:一种在组件发生故障时保证系统可用性的灵活方法。组件(N)至少有一个的后备组件(+1)1。简单来说,N 代表需要的总数,+1 代表我有一个备用的组件。

串联冗余:一种特定的N+1 配置。在这种配置下,通常由一个“主”UPS 模块给负载供电。这种配置要求主UPS 模块为静态旁路配置单独的输入电源。“串联”或“次要”UPS 向主UPS 模块的静态旁路供电,且完全保持空载2。

并联冗余:一种特定的N+1 配置。它由多个同一规格的UPS 模块并联在一根公用输出母线上组成。并联冗余系统要求UPS 模块的容量和型号相同2。

内部“模块化”冗余:一种特定的N+1 配置。由于没有相同的命名结构,该词是本文中定义的新术语;在这一配置下,“+1”发生在UPS 架构内,通常出现在功率模块层。在这一配置下,共用同一个背板、控制系统和电池设备。

电池设计

无论选择哪种N+1 配置,都可以改进所部署电池系统的容错方式。目前比较常见的做法是将多个电池组并联,以提供额外的冗余便于维护操作。使用这种方法时,倘若某个电池组出现故障,则其余电池组会在停电时为负载继续供电。请注意,虽然故障的电池组会缩短电池系统持续运行的时间,但仍有充裕的时间可以避免宕机的发生。

在本文中,我们重点比较并联冗余和内部“模块化”冗余——这两种N+1 配置中

的“+1”组件都是工作的(而非待机状态)。图1 从概念上说明每种情况下“+1”组件的位置。

并联冗余和内部“模块化”冗余在概念上

具体的UPS配置信息

为突出各权衡项的区别,我们选择一台不带冗余的UPS 与N+1 冗余 UPS 进行比较,因此中使用三种具体的配置。在这三种情况下,我们选择1MW 作为额定容量。

1. 作为比较基准的1N 配置:一台不带冗余的1000 kW UPS(由四个250 kW的“内部”模块组成);是一种基本的配置情况。

2. 内部“模块化”N+1 冗余配置:一台模块化的1000 kW UPS,由5 个250 kW的“内部”模块组成(4 个构成全部容量,1 个作为冗余)。

3. 并联N+1 冗余配置:3 台500 kW的UPS“主机”配置为并联冗余(2 台构成全部容量,1 台作为冗余)。

作为比较基准的1N 配置

在1N UPS 设计中,任何组件故障都需要将负载转移至UPS 旁路或旁路。最简单的例子就是由一个单一额定的UPS 为负载供电。有些UPS 设计为模块化、可扩展模式,而有些UPS 则为固定容量。我们所的1N UPS 采用模块化设计,在其单独的主机内由四个250 kW的模块组成,达到1000kW的额定容量。通过同时并联多个单元也可构成1N 架构,从而达到所需容量。图2 显示的是我们所的1N UPS。

作为比较基准的“N”配置

内部“模块化”N+1 冗余配置

正如我们在基准配置中所描述的一样,模块化UPS 通过添加一个额外的功率模块,也能提供N+1 冗余。请参见图3。这种内部模块化N+1 冗余配置其实就是在基准配置以外增加第五个250 kW模块即可。电池系统由四个并联电池组组成,每个电池组带有各自的断路器,因此一个电池组故障不会导致整个电池系统瘫痪。如图所示,UPS 输出母线和电池(直流)母线为所有模块公用,因此其代表了UPS 系统的单点故障,需要转换到旁路。

内部“模块化”冗余配置

并联N+1 冗余配置

用一条输出母线。每个UPS 的容量是500 kW,所以第三台UPS 即为“+1”冗余。如图所示,每台UPS 均带有一个并联冗余配置,且有其各自的电池系统(每台UPS 由3 个并联电池组组成),可提供额外的冗余等级,而这一冗余等级在模块化UPS 中并未提供。UPS 输出母线仍代表单点故障,除了这一配置,在另外两种配置中,输出母线位于UPS 外部,需要在现场进行安装。

并联冗余配置

请注意,有时候并联冗余UPS 会部署公用电池组。这么做的优势是节约了成本(电池支出费用更少),但这种配置从容错性/可靠性上来看,更类似于内部“模块化”配置。此方法遵循的假设是每台UPS 均使用的电池系统。

初始投资成本比较

一般来说,UPS 冗余配置的越多,则越昂贵。但对于数据中心管理人员而言,为业务设定特定的冗余级别存在较大难度。在本节中,我们将对前面所讨论的三种配置进行投资成本,以帮助决策者权衡成本/收益。

方和假设

在估算每种设计的成本时,会用到配置详细的单线图。投资成本包括材料费和安装费。安装费用包括人工费用和所有布线、导管、吊具、线耳等。材料费用包括UPS、维修旁路柜、输出断路器、电池系统和组装服务费用。我们并未将输入断路器计算在内,因为其通常会假定为已部署在楼宇内。

本中未包含的额外费用包括:吊装、储存、持续的维护和空间费用。即使对每个配置采用最理想的布局设计,第3 种配置所需的空间也要比其他两种配置多出25%左右,这代表建设数据中心空间时实现额外的节省。

这一的主要假设包括:

安装成本基于欧美市场平均电气安装费率。

所有线缆位于电气金属管件(EMT)内。

UPS 输入开关柜距离主开关柜15 米(50 英尺)远。

第1 和第2 种配置:1600A 3 线以及接地;

第3 种配置:2000A 3 线以及接地。

UPS 的位置距离UPS 输入开关柜3 米(10 英尺)远。

第1 和第2 种配置:1600A 3 线以及接地至1000 kW UPS;

第3 种配置:800A 3 线以及接地至每一台500 kW UPS(共3 台)。

输出UPS 开关柜距离UPS 3 米(10 英尺)远。

第1 和第2 种配置:1600A 3 线以及接地;

第3 种配置:700A 3 线以及接地。

(维护)旁路距离6 米(20 英尺)远。

第1 和第2 种配置:1600A 3 线以及接地;

第3 种配置:2000A 3 线以及接地。

负载距离UPS 输出开关柜15 米(50 英尺)远。

第1 和第2 种配置:1600A 3 线以及接地;

第3 种配置:2000A 3 线以及接地。

结果

图5 汇总了三种配置投资成本之间的差别。如图所示,内部“模块化”冗余配置的初始投资成本比并联冗余配置的初始投资成本低178 美元/kW(26.9%),而基本配置的初始投资成本比内部“模块化”冗余配置低29 美元/kW(6.1%)。

3 种配置每kW成本比较

表 1 提供了每种配置设计更详细的预计成本,按主要成本类别划分。所有费用统一为额定UPS 容量的每kW 成本价格。虽然小容量和大容量UPS 之间的单位kW 成本存在差别,但其对于各方法之间相对成本差具有合理的指导意义。

详细的成本比较结果

部署速度

除了两种N+1 配置之间存在投资成本差别外,其对于部署速度也会产生影响。在本节中,我们将讨论安装单台UPS 与安装一组并联冗余UPS 之间的区别。安装一台标准的1 MW UPS 大约需要6 至8 周时间(包括关键步骤之间的时间缓冲)。在这一时间框架内的主要活动包括:

为部署UPS 系统准备空间,包括混凝土放置平台。通常项目进度计划会为这一活动分配一周的时间。然后,空间准备和交付之间通常有一周的缓冲期,避免出现设备到位时部署空间仍未就绪的情况。

UPS 的交货和装配。一套1000 kW的UPS 系统重量和体积都十分庞大。对于这一步骤,一般会预留2 到3 天的项目计划时间。

为UPS 部署导管。馈电线为每条馈线取3 组3"的导管。这项工作可能需要一周时间。

拉线并端接。这项工作一般计划分配一周的时间。

安排启动和调试;在完成UPS 连接后到启动调试前,一般会留出一周的缓冲期。

这是考虑到安装过程中可能出现的意外情况。调试大约需要一周的时间。除了在架构中添加额外的功率模块,1N 设计和内部“模块化”冗余UPS 的安装步骤相同。因此,安装成本也相同。而对于并联冗余的UPS 配置,必须将大型UPS 并联到一起,所以并联系统的部署时间一般会增加1 至2 周或延长25%-30%的时间。在着手多单元安装以设置、配置并确保单元之间正常通信的额外现场作业包括:

用于更多馈电线的更多终端

更多需要部署就位的单元

更多需要启动的单元

更多需要进行负载组测试的单元

并联和同步检查

更多需要测试/执行的程序

更多的控制线路和监控点

采用模块化UPS 时,会使用多个内部“模块”来提高容量或冗余,因此上述工作会在出厂设置时完成,这不仅省时,而且也提高了最终结果的可预测性。除了加快初始安装速度外,模块化UPS 在日后扩容时所需的工作量最小(仅需数小时),而在将新UPS添加到非模块设计中时,布线、接线以及调试工作就需要花费数天或数周的时间。

对能效的影响

UPS 效率取决于其上运行的负载。由于增加冗余意味着增加额外的(备用)容量,因此冗余会对效率产生影响。假定1000 kW额定容量的负载率为80%,该值是数据中心操作人员一般设置的阈值,本白皮书所的UPS 配置在800kW负载下运行。表2说明在假定负载情况下,每个配置的负载百分比的含义。

配置对UPS负载的影响

然而,在低负载下,任何特定UPS 的效率会因为制造商、型号之间的不同而不同,应当作为规划过程的一部分加以调查。图 6 显示了两条UPS 曲线——其中一条曲线在轻负载率时的效率远低于满负载时(左图),另一条曲线相对较平坦(右图)。类似左侧的UPS 的固定损耗更大,这会造成在较低负载率时效率下降,并且在这种情况下增加冗余,将对电力成本带来较大的负面影响。类似右图的UPS,增加冗余对能源成本的影响可忽略不计。事实上,当负载率范围在40%至60%时,效率最佳。此外,使用权衡工具三相UPS 效率比较计算器可对这两个不同的UPS 曲线进行对比,以从中了解效率和电力成本的含义。当能源成本作为一项重要的决策标准时,在预期运行负载下评估UPS 至关重要。在配置中增加的冗余越多,运行负载率则越低。

效率与负载率的关系

左图的UPS在低负载率时效率比较低,右图的UPS效率曲线比较平坦。

风险承受能力

根据每个数据中心所支持应用的关键性,都会有一个风险承受能力。正如我们前面提到的,通过诸如虚拟化和超融合等技术,IT 层面的容错能力不断提高。基于所部署的IT技术、企业对硬件宕机成本的解读(包括定性和定量的)、不同UPS 配置的成本费用以及可用性的改进,可以决定UPS 冗余的恰当级别。

根据成本显示,从1N 设计到内部“模块化”N+1 冗余设计,成本小幅提升

(6.5%),而如果从内部“模块化”配置提升至并联冗余N+1 配置时,成本提高幅度较大(36.8%)。在本节中,我们将从定性角度分别讨论这三种配置的宕机风险。表3汇总了宕机风险。

宕机风险比较

1N 设计中,UPS 或其电池内发生任何故障,会导致负载转换到静态旁路。在这一运行模式下,市电故障将致使IT 硬件宕机

内部“模块化”冗余设计中,有一个备用功率模块,因此单个模块内的故障不需要转换到静态旁路。相反,该模块会自行脱机,但负载仍由其他工作模块供电。稍后可通过将整个UPS 连接到旁路更换故障模块。不过,在这一设计中,仍存在单点故障

例如,因为只有一个电池组,电池系统故障(如电池断路器脱扣)会迫使负载转换到静态旁路。同样,如果需要对UPS 进行预防性维护,那么负载将被转换到均未由电池保护的静态旁路或旁路。

并联UPS 冗余配置电池发生故障期间,负载依然受UPS 电源供电保护。不过,在加入控件、通信和电缆阻抗以确保负载在UPS 间共享会增加新风险。

在本文中,我们关注N+1 配置(其中N=2),但根据所需的总功率和UPS 规格,N 可能会多于2 台。随着N 增加,不仅成本和时间增加,而且可靠性会因为均衡所有运行模式下所有UPS的负载电流的难度增加而有所降低。

人为失误也会影响到各种配置的可用性。与设计相关的现场安装作业越多,则此类停机风险就越大。现场作业越多(即安装期间进行的现场作业),则因为人为失误导致宕机的风险越大;而工厂预制更具可预测性,也更加可靠。对于本文中提出的三种配置,请考虑输出母线故障(关键故障可能会导致负载掉电)。借助模块化UPS,这一母线会设计在UPS 内部,因此由工厂完成安装。在并联冗余UPS 配置下,输出母线在现场进行安装,从而增加了因为人为失误导致的宕机风险。

UPS 容错属性

容错指的是在系统某些组件发生故障时系统仍能继续运行(在此情况下,为支持IT 负载)。也就是说,有些UPS 会比其他UPS 的容错性更高。在选择UPS 时,重要的是要考虑系统容错设计属性;特别是如果所选架构由单个UPS 组成(如第1 种和第2 种配置)。以下是容错设计属性的例子:

功率模块冗余(逆变器/整流器)

风扇冗余

控制器内电源冗余

电池组冗余

通信总线冗余

控制系统冗余

规格高于最大预期负载的静态开关,以用于IT 设备和下游PDU 的峰值/阶跃负载。

通过解决传统UPS 系统中关键的单点故障问题,曾经需要更高冗余级别的数据中心(如2N 冗余),可能能够依靠这些机制来保证关键负载的正常运行。图7 是一台具有容错能力UPS 的示例。

带有容错设计属性的Galaxy VX UPS系列

一种普遍的看法是,需要物理方式分离的箱体来隔离故障;但并非始终需要物理方式分离,而是与箱体内的防御等级有关。

随着“N+1”配置成为数据中心更常见的UPS 架构,理解不同方法的权衡项就变得日趋重要,以便数据中心的决策者可以根据既定的风险承受能力、预算和时间尽可能做出最全面的决策。

结论

在本文中,我们讨论了两种常见N+1 部署方法在投资成本、部署时间、能效和可靠性方面的差异(并将其与1N 设计进行对比),以强调其中的差异。据此,我们得出如下重要结论:

成本:内部“模块化”N+1 冗余UPS 配置比1N 设计的投资成本高6.5%。与内部“模块化”冗余配置相比,并联冗余N+1 配置的投资成本高36.8%。

部署时间:并联冗余配置的部署时间比1N 配置或内部“模块化”N+1 配置要长约25-30%。这是因为需要额外的安装、配置和确保单元间的正常通信的现场作业所致。且并联冗余配置日后扩容所需的时间也更长。

能效:冗余会影响UPS 运行负载率,对于部分UPS,这意味着会影响效率和电力成本。不过,如今大多数UPS 的效率曲线较为平坦(低固定损耗),在部分负载运行下效率最大。故其对这一影响可忽略不计。

风险承受能力:与内部“模块化”配置相比,并联冗余配置将为数据中心负载提供更高的可用性。内部“模块化”冗余设计的风险承受能力介于1N 和并联冗余设计之间。在选择UPS 时,重要的是考虑是否为UPS 带来更高容错能力的设计属性。内部“模块化”冗余在规避风险方面具有显著收益,且成本小幅增加,而且不会对效率和部署时间有影响。并联冗余UPS 规避风险的能力虽然更大,但其成本和部署时间都要高出很多。最后,决策者的工作是权衡这些权衡项,以选择对于其业务需求最合适的设计。

举报/反馈

上一篇:比较UPS不间断电源系统设计的5种配置方案
下一篇:ups不间断电源基本介绍