3 verborgen afwegingen met enkele opstart AI-opslagoplossingen

Nieuwe opslagoplossingen voor startups zijn veelbelovende SDS-achtige voordelen met uitgebreide functies, eenvoudige bewerkingen en onbeperkte schaalbaarheid. Maar de complexe initiële implementaties en voortdurende stabiliteitsuitdagingen vertellen een ander verhaal.


Samenvatting

New startup storage solutions are promising SDS-like benefits with extensive features, simple operations, and unlimited scale. But the complex initial implementations and ongoing stability challenges tell a different story.

image_pdfimage_print

Dit is deel 3 van een vijfdelige serie die ingaat op de claims van nieuwe dataopslagplatforms. Lees deel 1 en deel 2.

Al meer dan een decennium is software-defined storage (SDS) naar verluidt een aantrekkelijk alternatief voor complexe en dure enterprise data storage. Een van de beweringen: ongeëvenaarde flexibiliteit, hardware-onafhankelijkheid en kostenbesparingen door commodity-hardware.

Helaas bleken real-world implementaties onpraktisch. Zelfs public clouds die hun infrastructuur aanvankelijk bouwden op basis van commodity hardwarecomponenten realiseerden zich dat efficiëntie op schaal alleen kon worden gerealiseerd door samen hardware en software te ontwikkelen. 

Versneld naar vandaag, en veel nieuwe, onbewezen startup-storage-oplossingen brengen zichzelf op de markt als “software-only” en “hardware-agnostisch”, veelbelovende SDS-achtige voordelen met uitgebreide functies, eenvoudige bewerkingen en onbeperkte schaal. Dat gezegd hebbende, kan dit waar zijn?

De Hype: Nieuwe SDS-oplossingen, dezelfde oude complexiteit

SDS-gebaseerde startups beloven naadloze opslagoplossingen, maar ze zijn verrast met complexe initiële implementaties, voortdurende stabiliteitsuitdagingen en spijt. Meer in het bijzonder resulteert het implementeren van deze systemen vaak in non-stop probleemoplossing, patching en experimenteren met verschillende opslagconfiguraties, wat frustratie en verlies van waardevolle middelen veroorzaakt. 

Deze SDS-oplossingen worstelen ook met inefficiënties. Grondstoffencomponenten zijn aantrekkelijk vanwege hun lage aanschafkosten; het gebrek aan optimalisatie en efficiëntie tussen hardware en software komt echter tot uiting in de energie-efficiëntie van deze systemen. Met de wereld op het punt van een energiecrisis is elke watt die wordt bespaard een watt die kan worden geleverd aan nieuwe workloads. En nu AI-investeringen toenemen, zal dit watt kostbaar zijn! Laten we eens kijken naar een aantal van de duurzame storage management-lasten die de implementatie van deze oplossingen meestal volgen.

1. Initiële implementatie is een hoofdpijn

De uitdagingen beginnen direct bij de implementatie. Het installeren van deze systemen kan een beetje lijken op het proberen op te lossen van een Millenniumprijsprobleem. De hardware is een ingewikkelde combinatie van computeboxen, storageboxen, switching fabric en veel kabels. Ondanks de beweringen dat deze oplossingen “hardware-agnostisch” zijn, hebben ze eigenlijk een beperkte set specifieke componenten van geselecteerde “gecertificeerde of gekwalificeerde leveranciers”. Met al deze variatie is de initiële configuratie complex, met variatie tussen componenten, waardoor organisaties vaak wekenlang met door leveranciers opgeleide engineers moeten werken om het systeem operationeel te krijgen.

Helaas is de tijd tot de eerste I/O nog maar het begin. 

Hoewel deze nieuwe opslagoplossingen beweren rijk te zijn aan functies, zijn veel functies afkomstig van verschillende open-source software. Veel van deze functies zijn niet bedrijfsklaar en het correct configureren ervan blijkt complex te zijn. Sommige van deze belangrijke functies zijn standaard uitgeschakeld, waardoor operationele hoofdpijn op de weg ontstaat. Eén leverancier schakelt bijvoorbeeld standaard Data-at-Rest Encryption (D@RE) uit, wat cruciaal is om klantgegevens veilig te houden. Hoewel D@RE kan worden ingeschakeld nadat het systeem operationeel is, kan dit onvoorspelbaar gevolgen hebben voor de voortdurende prestaties, misschien zelfs als een systeem niet aan de prestatie-SLA’s kan voldoen. Self-encrypting drives (SED’s) kunnen de impact op de systeemprestaties tijdens de encryptie minimaliseren, maar zijn meestal aanzienlijk duurder dan gewone drives. In tegenstelling tot wat de prestatiebenchmark van deze leverancier met encryptie off kan opleveren, moeten klanten die deze oplossing implementeren kiezen tussen het accepteren van een prestatie-impact of het betalen van extra kosten om SED’s aan te schaffen.

2. Dagelijkse activiteiten zijn een uitdaging

Helaas wordt het gebruik van deze nieuwe opslagoplossingen niet eenvoudiger nadat de eerste implementatie is voltooid. Klanten moeten waakzaam blijven om ervoor te zorgen dat hun opslagsysteem optimaal werkt. Dat betekent dat u te maken moet hebben met een verscheidenheid aan patches van derden en zelfs aangepaste softwarefixes, wat de downtime en het risico kan verhogen en de oplossingstijd kan verlengen. Velen hebben beperkte monitoringmogelijkheden die enige reactieve informatie over de array en gebruikersstatistieken en foutmeldingen bieden, maar ze kunnen geen problemen automatisch detecteren, self-service-oplossingen aanbieden of toekomstige vereisten voorspellen. 

Deze nieuwe opslagoplossingen vertonen alle kenmerkende SDS-problemen met het behalen van prestatie-, betrouwbaarheids-, efficiëntie- en schaaldoelstellingen. In theorie kunt u reken- en opslagnodes onafhankelijk schalen in verschillende hoeveelheden, indien nodig. In werkelijkheid worden de compute- en storagenodes samen geschaald, wat vaak leidt tot overprovisioning van resources en workload balancing. Zelfs als deze worden geschaald zoals voorgesteld, leveren deze oplossingen vaak geen consistente prestaties in alle scenario’s, met name bij kleine I/O. Naarmate de clusters schalen en asymmetrisch worden, is er nog meer kans op onvoorspelbaarheid en onbalans in prestaties.

Het is geen verrassing dat sommige van deze nieuwe opslagleveranciers zich moeten verstoppen onder het mom van een speciaal Slack-kanaal en toegewijde technische experts moeten toewijzen om voortdurende ondersteuning te bieden voor elk van hun installaties. Hoewel we de noodzaak begrijpen van deze misleide inspanningen om hun instabiliteit en complexiteit te maskeren, komt het klanten op de lange termijn niet ten goede.

3. Ramificaties op lange termijn kunnen ernstig zijn

Deze SDS-gebaseerde opslagoplossingen voegen onvoorziene risico’s toe aan de opslagomgevingen van hun klanten, zowel vanuit het oogpunt van hardware als software. Vanuit softwareperspectief claimen deze storage-startups een uitgebreide set functies en all-inclusive ondersteuning. Veel van deze functies zijn zelfs inbegrepen op het moment van aankoop zonder extra kosten, maar met een disclaimer dat bestaande of toekomstige functies afzonderlijk in licentie kunnen worden gegeven. Vanuit hardwareperspectief hebben we de complexiteit van de implementatie van verschillende gespecialiseerde componenten besproken. Sommige van deze componenten hebben al bewezen niet levensvatbaar te zijn op de lange termijn van de markt en hebben invloed op het vermogen van een organisatie om hun investering te beschermen door hun architectuur op de lange termijn te schalen en te benutten. Forklift-upgrades en groothandelsmigraties zijn pijnlijk, dus de levensvatbaarheid van elke architectuur op lange termijn is essentieel.

Hier is een voorbeeld: Eén specifieke SDS-opslagoplossing maakt gebruik van “Optane” storage class memory (SCM) in de architectuur als een cruciale prestatieverhoger. De SCM wordt gebruikt als een landingsplaats voor schrijven, teruglezen en Metadata. Nu Intel het Optane-programma stopzet, beweert de storage startup dat verbeterde SLC SCM zonder problemen kan vervangen. De waarheid is dat SLC slechts een derde van de schrijfprestaties en inconsistente latency heeft, waardoor de clusterprestaties negatief worden beïnvloed en onvoorziene kosten worden toegevoegd. Ten slotte maakt de gepatenteerde netwerkarchitectuur die in deze SDS-oplossingen wordt gebruikt, het naadloos schalen naar grote capaciteiten complex en tijdrovend om te werken.

Eenvoud als kernprincipe

Nu moderne workloads zoals large language models (LLM’s) en retrieval-augmented generation (RAG) centraal staan, hebben organisaties een performant dataplatform nodig – geen opslagoplossing die beweert een modern SDS te zijn. 

Bij Pure Storage gaan we deze uitdagingen aan door vanaf de eerste dag eenvoud in onze producten te ontwerpen. Het Pure Storage-platform levert een intuïtief ontwerp en eenvoud tijdens installatie, beheer en schaalbaarheid, waardoor organisaties het meeste uit hun data kunnen halen. We bieden ook toonaangevende dichtheid en energie-efficiëntie, gedreven door de nauwe integratie tussen ons Purity-besturingssysteem en onze DirectFlash®-modules.

Ga verder dan de hype. Ontdek hoe het Pure Storage-platform uw infrastructuur toekomstbestendig kan maken en het volledige potentieel van uw AI-initiatieven kan ontsluiten.