데이터센터의 역할과 기능이 변화하면서 데이터센터를 직접 구축하고 운영하는 대신 임대를 고민하는 기업이 증가하고 있습니다. 전산실이나 데이터센터를 확장하거나 이전해야 한다면 기업의 IT인프라에 적합한 데이터센터는 어떤 것일까요? 이번 포스팅에서는 데이터센터를 선택할 때 필요한 비교 지표에 대해 살펴봅니다.
데이터센터 비교
규모, 성능, 효율, 비용, 입지와 자연환경 등 다양한 비교 요소들이 있지만, 1편에서는 규모와 성능 측면의 비교 지표에 대해 설명합니다. 데이터센터 간 규모와 성능은 대표적으로 용량(Capacity), 가용성(Redundancy), 효율성(Efficiency)을 통해 비교 할 수 있습니다.
용량 (Capacity) : 데이터센터가 수용할 수 있는 IT인프라의 최대 용량으로 데이터센터의 규모를 나타낼 때 사용되는 지표입니다. 전통적으로 데이터센터의 규모는 주로 면적이나 랙수량으로 표시되어 왔습니다. 거의 모든 데이터센터가 2~3kW의 랙전력을 공급하기 때문인데, 최근 랙전력의 다양성으로 인해 면적 및 랙수량과 더불어 데이터센터의 IT부하(IT load, IT인프라가 사용할 수 있는 전기 용량)를 통해 규모를 가늠하고 비교하는 사례가 증가하고 있습니다.
가용성 (Redundancy) : 데이터센터에 입주한 IT인프라가 중단없이 가동되는 수준을 말합니다. 데이터센터는 입주하는 고객에게 특정 수준의 가용성을 공급합니다. 가용성 수준은 두 가지 지표로 판단 할 수 있습니다. 첫 번째는 티어(Tier) 입니다. 티어는 인프라스트럭처(기계, 전기, 통신, 소방 등) 설비의 백업 구성 수준을 등급화 한 것으로 '데이터센터 가용성 지표 - 티어(Tier)'에 자세한 내용이 설명되어 있습니다. 두 번째 지표는 업타임(Uptime) 입니다. 데이터센터 마다 보증하는 IT인프라의 연간 가동 시간이 백분율로 표시됩니다. 약속된 가동 시간은 공급서비스 수준 약관 (Service Level Agreement, SLA)이라는 계약을 통해 보장됩니다.
효율 (Efficiency) : 효율은 데이터센터 인프라스트럭처(기계, 전기, 통신, 소방 등) 설비의 에너지 효율을 말합니다. 생성형 AI의 상용화가 확산되면서 GPU 서버의 수요가 증하하고 있습니다. AI 워크로드는 일반 대비 10배에서 20배 이상의 전력을 소모합니다. 데이터센터는 일반 건축물 대비 기계와 전기 설비에 비용의 약 50%가 투입되는 만큼 해당 설비의 운영 효율은 운영 비용 절감과 직결됩니다.
데이터센터 용량, 가용성, 효율 지표
데이터센터의 용량, 가용성, 효율성은 각각 몇 가지 지표들을 통해 정량적으로 확인할 수 있습니다. 용량을 나타내는 지표로는 데이터센터 내 전산실의 면적, 랙 수량 또는 랙 전력, IT부하(IT load, IT 장비에 공급되는 전기)가 있습니다. 가용성은 센터 전체의 가용성 수준을 나타내는 티어(Tier)를 주로 사용하고 센터를 구성하는 설비 각각의 가용성은 N 지표를 사용합니다. 효율성은 PUE가 대표적인 지표입니다. 성능별 지표와 의미는 다음과 같이 해석할 수 있습니다.
용량
데이터센터의 용량은 규모를 의미합니다. 얼마나 많은 랙을 수용할 수 있는지를 나타내는 척도인데, 2kW 로 랙전력이 획일적이던 과거에는 면적으로 센터간 규모를 비교할 수 이었습니다. 머신러닝과 AI로 인해 전력소모가 50kW가 넘는 등 랙전력이 다양해지면서 면적보다는 IT부하로 데이터센터의 규모를 판단하는 사례가 증가하고 있습니다. 최근 지어지는 대형 데이터센터의 IT부하가 20MW 이상 인것이 이러한 추세를 말해줍니다.
전산실 면적 : 평 또는 sqm (square meter). 면적이 넓을수록 확장성에 유리한 구조를 가진 센터로 평가할 수 있음
랙수량 : 수용 가능한 랙 수량은 면적과 비례하여 수량이 많을수록 확장성에 유리한 구조로 평가할 수 있음
랙전력 : 랙당 kW. 랙 전력의 상승 추세가 지속되면서 데이터센터의 주요한 평가 지표가 되고 있음
IT부하 : kW또는 MW. 데이터센터가 IT장비에 공급할 수 있는 총 전력량
[그림1. 평균 랙집적도 증가 추세]
출처 : Uptime institute 의 rack density is rising (2020)
가용성
데이터센터의 성능 지표중 가용성은 무엇보다 중요합니다. 전산실의 IT장비가 중단없이 운영될 수 있는 수준을 말해주기 때문입니다. IT장비가 최적의 상태로 가동될 수 있도록 데이터센터는 수많은 기계, 전기, 소방, 보안 설비들을 운영합니다. 이 설비들을 운영하다 보면 가동이 중단되는 상황이 발생합니다. 예상하지 못한 장애, 정기적인 테스트 및 점검, 수명이 다한 설비나 부품 교체를 위한 계획된 유지보수의 세 가지 경우가 대표적입니다. 세가지 상황 모두에서 IT장비의 무중단 운영이 가능하다면 높은 등급의 가용성을 공급하는 데이터센터로 평가됩니다.
티어(Tier) : IT장비의 무중단 운영의 수준과 등급을 나타내는 지표로, 주로 센터 전체의 가용성 수준을 나타냄. 등급이 높을수록 높은 가용성을 공급하도록 설계된 데이터센터로 판단 할 수 있음
티어 등급 |
TIER I |
TIRE II |
TIER III |
TIER IV |
수준 |
Basic Capacity |
Redundant Capacity Components |
Concurrently Maintainable |
Fault Tolerance |
의미 |
설비의 장애 발생 시 또는 유지보수 시 IT장비의 운영 중단 |
설비의 장애 발생 시 IT장비의 무중단 운영 가능 |
설비의 유지보수 시 IT장비의 무중단 운영 가능 |
IT장비의 무중단 운영 가능 (2N의 동시 장애 제외) |
구성 (장비) |
N |
N+1 |
N+1 |
2N |
구성 (경로) |
N |
N+1 |
N+1 |
2N |
N : 센터를 구성하는 주요 설비별 가용성 수준을 나타냄. N은 기본 용량(Capacity) 및 경로(Path 또는 Distribution)을 말하며, N을 기준으로 N+1, 2N 등으로 표현. N 방식에 대해서는 이후 전기 시리즈에서 별도 포스팅 예정.
효율
PUE (Power Usage Effectiveness) : 데이터센터가 전기를 얼마나 효율적으로 사용하도록 설계되고 운영되는지를 판단하는 지표. 총부하(센터 전체가 사용할 수 있는 전기 용량)를 IT부하(IT장비가 사용할 수 있는 전기 용량)로 나눈 값으로, 쉽게 말하며, 센터가 가진 총전기용량중 얼마만큼을 IT장비에 공급할 수 있는지를 말합니다. 보통 1에서 2사이의 값을 가지며, 1에 가까울수록 높은 효율을 가지도록 설계되고 운영되는 센터로 평가할 수 있습니다.
해당 콘텐츠는 저작권법에 의해 보호받는 저작물로 다우기술에 저작권이 있습니다.
해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.
Featured images via gettyimages.
References
1. Uptime Institute : Rack Density is Rising (2020)