AI가 기업에 대단한 영향을 미칠 것은 분명하지만, 기업을 지원하는 엔터프라이즈 IT 아키텍처에는 어떤 영향을 미칠까요? 최근에 저는 Gestalt IT 팟캐스트에서 AI가 전력 사용, 랙 공간, 데이터 지배구조와 규정 준수 등 모든 것에 어떤 영향을 미치는지 이야기를 나누었습니다.
팟캐스트를 시청한 후 핵심 내용을 확인해 보세요.
AI에서 가장 중요한 것은 데이터입니다.
새로운 애플리케이션이 나올 때마다 항상 지원 시스템에 대해 다시 생각을 해보게 되지만, AI의 영향력은 특히 더 큽니다.
팟캐스트에 패널로 참여한 TechArena의 앨리슨 클라인(Allyson Klein)은 “작년 가을에 ChatGPT가 처음 소개되었을 때, 모든 사람들이 엔터프라이즈 IT 측면에서 무언가가 완전히 변할 것이라는 걸 알게 되었다”며 “우리는 처리에 초점을 두지만, 사실 중요한 것은 데이터”라고 말했습니다.
AI는 상대적으로 새로운 애플리케이션일 수 있지만, 그 원칙은 다르지 않습니다. 기업들은 축적한 데이터를 기반으로 더 빠른 의사 결정을 내리길 원합니다. 그러나 기업들이 AI를 위해 구축하고 있는 것은 과거에 우리가 구축한 것과는 전혀 다릅니다. 앨리슨은 가장 비슷하다고 할 수 있는 것이 고성능 컴퓨팅(HPC)을 위한 인프라이지만, 이는 엔터프라이즈 IT 영역에서는 거의 존재하지 않았으며 일반적으로 학계와 연구의 범위에 머물러 있다고 말합니다.
“대부분의 기업은 HPC를 사용하지 않는다. HPC를 사용하는 경우에도, 이는 다른 워크플로우와 보통 혼용되지 않고 사일로처럼 취급되고 별도로 관리된다. AI가 약속하는 주요 혜택이 모든 데이터에 액세스하여 기업 전체의 워크플로우를 변화시키는 것이라면, HPC 솔루션(영문자료)에서 교훈을 얻을 수는 있지만, 똑같이 복제할 수는 없다.”
자세히 보기: ‘보다 간단하고 확장 가능한 HPC 스토리지 모델을 향하여’
용도를 변경할 수 없다면, 재설계해야 합니다.
대부분의 엔터프라이즈 인프라는 본질적으로 AI를 위해 설계되지 않았지만, 그것만이 도전과제는 아닙니다. 팟캐스트에서 CTO Advisor의 대표 키스 타운센드(Keith Townsend)는 AI 인프라가 그저 새로운 것일 뿐 아니라 대부분의 엔터프라이즈 IT 전략에 반하는 여러 가지 방식으로 작용한다고 말했습니다. 이는 부분적으로 AI 애플리케이션의 수명주기가 기존 엔터프라이즈 애플리케이션보다 더 반복적이기 때문입니다.
또 다른 도전과제는 기존 IT를 위해 설계된 대부분의 데이터센터는 물리적 공간이나 전력 소비의 측면에서 제한되어 있기 때문에 잠재적으로 막대한 설치 공간과 전력 소비가 필요한 AI를 감당할 수가 없다는 것입니다. 앨리슨은 많은 기존 데이터센터가 이러한 GPU 클러스터에 전력을 지원하도록 설계되지 않았다고 지적했습니다. 한 고객이 기존 데이터센터에 AI 워크로드를 배포하려고 했을 때 이런 상황을 생기는 걸 실제로 목격한 적이 있습니다. 전력 제약으로 인해 랙당 겨우 GPU 서버 2대를 배포할 수 있었고, 랙의 3분의 2는 사용할 수 없었습니다.
끊임없이 증가하는 전력 비용과 데이터센터의 공간 때문에, 우리는 이 문제를 지속 가능하게 해결하는 방법을 진지하게 생각해 봐야 합니다.
AI와 ESG의 ‘E’
키스는 “우리의 환경은 이렇게 과도한 워크로드를 위해 설계되지 않았다. 하나의 코로케이션에서 일반적인 랙은 랙당 5-10kW의 전력이 필요하지만 AI 배포에서는 서버 하나에도 그만큼이 필요할 수 있다. 게다가 이러한 유형의 워크플로우에는 랙당 45-100kW의 전력이 필요하므로 냉각 문제가 발생한다”고 말했습니다.
ESG에서 ‘E’는 자주 언급이 됩니다. 이는 지정학, 기후 변화, 에너지 제약 및 지속가능성 목표로 인해 올플래시 데이터센터(영문자료)가 유일한 대안라는 사실을 뒷받침해줍니다.
클라우드의 난제: AI를 아웃소싱할 수 있을까요?
대부분의 데이터센터가 범용 컴퓨팅을 위해 구축되었습니다. AI를 위해 개조할 수 없다면, 기업은 범용 아키텍처를 AI에 맞게 확장 가능하고 효율적으로 만들거나, 클라우드를 활용하거나, 두 가지 모두를 수행할 수 있습니다.
클라우드는 AI 같은 일부 사용 사례에 유용할 수 있지만, 모든 문제를 해결해주지는 않습니다. 이 때문에 데이터 지배구조, 가시성 및 ESG와 관련된 고려 사항(또는 단점)이 등장했습니다. 클라우드는 기업들이 보고해야 하는 전력 및 냉각 소비 내역을 가리고 데이터가 상주할 또 다른 장소를 만들 수 있습니다. 많은 조직들은 이미 어떤 데이터가 어디에 있는지 파악하는 데 어려움을 겪고 있으며 클라우드는 이러한 문제를 악화시킬 수 있습니다. 얼마나 많은 기업이 전체 AI 인프라를 구축하거나 클라우드를 비밀 소스로 활용하는지는 아직 지켜봐야 할 부분이지만, 변화가 다가오고 있습니다.
새로운 AI 중심 인프라는 어떤 모습일까요?
간단히 말해 차세대 범용 인프라입니다.
새로운 시스템이 어떻게 설계되든, 모든 시스템을 하나로 묶어주는 것은 이들이 사용하고 공유하는 데이터입니다. 앨리슨은 “AI에서 중요한 것은 데이터”라며 “기업이 이 기술을 활용하려면 스토리지 혁신이 최전선에 있어야 한다”고 말했습니다.
새로운 아키텍처는 전문화되는 것이 아니라 유연하게 분리 가능하도록 설계되어야 한다는 의견에 모두가 동의했습니다. 수직적으로 통합된 사일로가 아니라 기업의 가장 큰 데이터 당면 과제를 해결하기 위해 최적화된 리소스 풀의 형태가 되어야 한다는 것입니다. 이는 정교한 워크로드나 가속기 같은 광범위한 사용 사례를 위한 범용 인프라를 구축해야 한다는 것을 의미합니다.
“AI는 내부적으로 많은 데이터 공유를 통해 혜택을 얻을 것이다. 다양한 데이터 세트에서 공급이 가능한 이점을 활용할 수 있다. 이는 AI 처리에 범용 아키텍처를 더 많이 사용할 수 있도록 하는 큰 동인이다.” – Gestalt IT 온프레미스 팟캐스트
확장성이 뛰어난 소수의 플랫폼은 분석, 파일, 오브젝트 등 모든 워크로드에서 엔터프라이즈 IT의 미래를 간소화할 수 있습니다. 이를 통해 IT 팀은 범용 기능을 확산하고 확장할 수 있으며, AI가 기업 IT에 미치는 영향을 생각보다 적게 만들 수 있습니다.
퓨어스토리지: AI를 위한 더 나은 데이터 스토리지 플랫폼
여러 다른 데이터 세트와 데이터의 공유가 필요해졌기 때문에, 구성 가능한 새로운 인프라에 있는 모든 리소스가 데이터를 활용할 수 있도록 통합이 되어야 합니다. 그렇지 않으면 용량의 관점이나 데이터 컴플라이언스와 지배구조의 측면에서 많은 낭비가 발생합니다.
퓨어스토리지의 플래시블레이드//S(FlashBlade//S) 같이 AI를 위해 구축된 데이터 스토리지 플랫폼(영문자료)이 이 부분에서 도움이 됩니다. 기존 스토리지가 차세대 AI 기반 데이터센터에 적합하지 않다는 것은 기정 사실입니다.
퓨어스토리지는 혁신을 통해 기존의 복잡성을 제거하고 AI 데이터 파이프라인의 모든 과제를 해결할 수 있는 시스템을 구축함으로써 기업이 이러한 어려운 작업을 쉽게 수행할 수 있도록 만들었습니다. 처리량이 많은 고성능 파일 및 오브젝트 워크로드를 처리하는 것에서부터 대규모 아카이빙 오브젝트 저장소 요구사항을 충족하는 것까지, 엔터프라이즈급 플래시 기능을 디스크와 동일한 비용으로 활용할 수 있습니다.
AI를 위한 퓨어스토리지의 혁신에 대해 자세히 알아보고, 백서 ’ Toward a More Simple, Scalable HPC Storage Model (영문자료)’를 확인해보세요.