이는 새로운 데이터 스토리지 플랫폼의 주장에 대한 5부 시리즈의 3부입니다. 파트 1과 파트 2를 읽어보세요.
10년 이상 소프트웨어 정의 스토리지(SDS)는 복잡하고 값비싼 엔터프라이즈 데이터 스토리지를 위한 강력한 대안이라고 주장했습니다. 그 중에서도 탁월한 유연성, 하드웨어 독립성 및 상용 하드웨어의 비용 절감이 있습니다.
안타깝게도 실제 구현은 비현실적인 것으로 입증되었습니다. 초기에 상용 하드웨어 구성 요소에 인프라를 구축한 퍼블릭 클라우드조차도 대규모의 효율성은 엔지니어링 하드웨어와 소프트웨어를 함께 사용해야만 실현할 수 있다는 사실을 깨달았습니다.
검증되지 않은 많은 새로운 스타트업 스토리지 솔루션은 “소프트웨어 전용” 및 “하드웨어 애그노스틱”으로 마케팅되고 있으며, 광범위한 기능, 간단한 운영 및 무제한 확장을 통해 SDS와 같은 이점을 약속합니다. 그렇다고 해도 사실일까요?
더 하이프: 새로운 SDS 솔루션, 기존과 동일한 복잡성
SDS 기반 스타트업은 원활한 스토리지 솔루션을 약속하지만, 복잡한 초기 구현, 지속적인 안정성 문제 및 유감스러운 문제에 직면해 있습니다. 보다 구체적으로, 이러한 시스템을 구축하면 종종 중단 없는 문제 해결, 패치 적용 및 다양한 스토리지 구성에 대한 실험이 이루어지며, 이로 인해 좌절감을 느끼고 귀중한 리소스를 잃게 됩니다.
이러한 SDS 솔루션은 비효율성에도 어려움을 겪고 있습니다. 원자재 부품은 구입 비용이 낮기 때문에 매력적이지만, 하드웨어와 소프트웨어 간의 최적화 및 효율성 부족은 이러한 시스템의 에너지 효율성에 나타납니다. 전 세계가 에너지 위기에 직면함에 따라, 절감된 모든 와트는 새로운 워크로드로 프로비저닝될 수 있는 와트입니다. 그리고 AI 투자가 증가하면, 이러한 전력은 소중해질 것입니다! 이러한 솔루션의 구현을 따르는 경향이 있는 지속적인 스토리지 관리 부담에 대해 살펴보겠습니다.
1. 초기 구축은 두통입니다.
문제는 구축에서 시작됩니다. 이러한 시스템을 설치하면 밀레니엄 상 문제를 해결하려고 시도하는 것처럼 느껴질 수 있습니다. 하드웨어는 컴퓨팅 박스, 스토리지 박스, 스위칭 패브릭 및 많은 케이블의 복잡한 결합입니다. “하드웨어에 구애받지 않음”이라는 주장에도 불구하고, 이러한 솔루션은 실제로 선정된 “인증 또는 적격 벤더”의 좁은 특정 구성 요소를 가지고 있습니다. 이러한 모든 다양성을 갖춘 초기 구성은 복잡하며, 구성 요소 간에 차이가 나기 때문에, 조직에서는 벤더 교육을 받은 엔지니어와 협력하여 시스템을 가동하는 데 몇 주가 걸립니다.
불행히도 첫 번째 I/O까지 걸리는 시간은 시작에 불과합니다.
이러한 새로운 스토리지 솔루션은 기능이 풍부하다고 주장하지만, 많은 기능이 다양한 오픈소스 소프트웨어에서 파생됩니다. 이러한 기능 중 대부분은 엔터프라이즈에 적합하지 않으며 올바르게 구성하면 복잡합니다. 이러한 주요 기능 중 일부는 기본적으로 꺼져 있기 때문에 운영에 지장을 줄 수 있습니다. 예를 들어, 한 벤더는 기본적으로 D@RE(Data-at-Rest Encryption)를 끄는데, 이는 고객 데이터를 안전하게 유지하는 데 매우 중요합니다. D@RE는 시스템을 가동하고 실행한 후 활성화할 수 있지만, 이는 지속적인 성능에 예상치 못한 영향을 미칠 수 있으며, 시스템이 성능 SLA를 충족하지 못할 수도 있습니다. 자체 암호화 드라이브(SED)는 암호화 중 시스템 성능에 미치는 영향을 최소화할 수 있지만, 일반 드라이브보다 훨씬 더 많은 비용이 드는 경향이 있습니다. 암호화가 꺼진 이 벤더의 성능 벤치마크 결과와는 달리, 이 솔루션을 배포하는 고객은 성능 영향을 수락하거나 SED를 취득하기 위해 추가 비용을 지불하는 것을 선택해야 합니다.
2. 일상적인 운영은 어려운 과제입니다.
안타깝게도 초기 구축이 완료된 후에는 이러한 새로운 스토리지 솔루션을 더 쉽게 운영할 수 없습니다. 고객은 스토리지 시스템이 최적으로 실행되도록 경계해야 합니다. 즉, 다양한 타사 패치와 맞춤형 소프트웨어 수정을 처리하여 다운타임과 위험을 높이고 해결 시간을 연장할 수 있습니다. 어레이와 사용자 통계 및 오류 경보에 대한 일부 대응 정보를 제공하는 모니터링 기능은 제한적이지만, 문제를 자동 감지하거나 셀프 서비스 솔루션을 제공하거나 향후 요구 사항을 예측할 수는 없습니다.
이러한 새로운 스토리지 솔루션은 성능, 안정성, 효율성 및 확장 목표를 충족하는 것과 관련된 모든 SDS 문제를 보여줍니다. 이론적으로, 필요에 따라 컴퓨팅 및 스토리지 노드를 서로 다른 양으로 독립적으로 확장할 수 있습니다. 실제로 컴퓨팅 및 스토리지 노드는 함께 확장되어 리소스의 오버프로비저닝과 워크로드 밸런싱을 야기합니다. 제안된 대로 확장하더라도 이러한 솔루션은 모든 시나리오, 특히 작은 I/O에서 일관된 성능을 제공하지 못하는 경우가 많습니다. 클러스터가 확장되고 비대칭이 되면 예측 불가능성과 성능 불균형이 발생할 가능성이 훨씬 더 높습니다.
이러한 새로운 스토리지 벤더들 중 일부는 전용 Slack 채널의 속에 숨어 각 설치에 대한 지속적인 지원을 제공할 전담 엔지니어링 전문가를 지정해야 한다는 것은 놀라운 일이 아닙니다. 퓨어스토리지는 불안정성과 복잡성을 감추기 위한 이러한 잘못된 노력의 필요성을 이해하고 있지만, 장기적으로는 고객에게 도움이 되지 않습니다.
3. 장기적인 레이밍은 심각할 수 있습니다.
이러한 SDS 기반 스토리지 솔루션은 하드웨어 및 소프트웨어 관점에서 고객의 스토리지 환경에 예상치 못한 위험을 추가합니다. 소프트웨어 관점에서 이러한 스토리지 스타트업은 풍부한 기능 세트와 올인클루시브 지원을 주장합니다. 이러한 기능 중 다수는 추가 비용 없이 구매 시점에 포함되어 있지만, 기존 또는 향후 기능에 대한 별도 라이선스가 부여될 수 있다는 부인이 있습니다. 하드웨어 관점에서는 다양한 특수 구성 요소를 배포하는 복잡성에 대해 논의했습니다. 이러한 구성 요소 중 일부는 이미 시장에서 장기적으로 실행 가능하지 않으며 아키텍처를 장기적으로 확장 및 활용하여 투자를 보호하는 조직의 능력에 영향을 미치는 것으로 입증되었습니다. 포크리프트 업그레이드와 도매 마이그레이션은 매우 까다롭기 때문에 모든 아키텍처의 장기적인 실행이 필수적입니다.
예시는 다음과 같습니다. 하나의 특정 SDS 스토리지 솔루션은 아키텍처에서 “Optane” 스토리지 클래스 메모리(SCM)를 중요한 성능 구현 요소로 사용합니다. SCM은 쓰기, 읽기백 및 메타데이터를 위한 랜딩 장소로 활용됩니다. 인Intel이 옵탄 프로그램을 중단함에 따라 스토리지 스타트업은 향상된 SLC가 SCM을 문제 없이 대체할 수 있다고 주장합니다. SLC는 쓰기 성능의 1/3에 불과하며, 일관성 없는 레이턴시를 제공하여 클러스터 성능에 악영향을 미치고 예상치 못한 비용을 증가시킵니다. 마지막으로, 이러한 SDS 솔루션에 사용되는 독점적인 네트워킹 아키텍처는 운영에 복잡하고 시간이 많이 걸리는 대용량으로 원활하게 확장할 수 있도록 합니다.
핵심 원칙으로서의 단순성
대규모 언어 모델(LLM) 및 검색 증강 세대(RAG)와 같은 현대적인 워크로드가 중심에 있기 때문에, 조직은 현대적인 SDS라고 주장하는 스토리지 솔루션이 아닌 고성능 데이터 플랫폼이 필요합니다.
퓨어스토리지는 첫날부터 제품에 단순성을 적용하여 이러한 문제를 해결합니다. 퓨어스토리지 플랫폼은 설정, 관리 및 확장 시 직관적인 설계와 단순성을 제공하여 조직이 데이터를 최대한 활용할 수 있도록 지원합니다. 퓨어스토리지는 Purity와 에너지 효율성을 제공합니다. DirectFlash
과감함을 뛰어넘으세요. 퓨어스토리지 플랫폼이 어떻게 인프라의 미래를 보장하고 AI 이니셔티브의 잠재력을 극대화할 수 있는지 알아보세요.
