Resumen
New startup storage solutions are promising SDS-like benefits with extensive features, simple operations, and unlimited scale. But the complex initial implementations and ongoing stability challenges tell a different story.
Esta es la tercera parte de una serie de cinco partes que analiza las afirmaciones de las nuevas plataformas de almacenamiento de datos. Lea la parte 1 y la parte 2.
Durante más de una década, el almacenamiento definido por software (SDS) ha afirmado ser una alternativa convincente para el almacenamiento de datos empresarial complejo y caro. Entre sus afirmaciones se encuentran la flexibilidad, la independencia del hardware y el ahorro de costes sin igual del hardware básico.
Por desgracia, las implementaciones en el mundo real resultaron poco prácticas. Incluso las nubes públicas que inicialmente construyeron su infraestructura a partir de componentes de hardware básicos se dieron cuenta de que las eficiencias a escala solo podían lograrse mediante la ingeniería conjunta del hardware y el software.
Avance rápidamente hasta la actualidad, y muchas soluciones de almacenamiento nuevas y no probadas para startups se están comercializando como «solo software» y «independiente del hardware», lo que promete beneficios similares a los SDS con amplias características, operaciones sencillas y escala ilimitada. Dicho esto, ¿puede ser cierto?
La sobreexpectación: Nuevas soluciones SDS, la misma complejidad antigua
Las startups basadas en SDS prometen unas soluciones de almacenamiento perfectas, pero están afectadas por complejas implementaciones iniciales, constantes problemas de estabilidad y lamentaciones. Más concretamente, el despliegue de estos sistemas suele dar como resultado una resolución de problemas, una aplicación de parches y una experimentación constantes con diferentes configuraciones de almacenamiento, lo que provoca frustración y pérdida de recursos valiosos.
Estas soluciones SDS también tienen problemas con las ineficiencias. Los componentes básicos son atractivos debido a su bajo coste de adquisición; sin embargo, la falta de optimización y eficiencia entre el hardware y el software se refleja en la eficiencia energética de estos sistemas. Con el mundo a punto de sufrir una crisis energética, cada vatio ahorrado es un vatio que puede aprovisionarse para nuevas cargas de trabajo. Y con el aumento de las inversiones en IA, ¡estos vatios serán muy valiosos! Veamos algunas de las cargas duraderas de la gestión del almacenamiento que tienden a seguir la implementación de estas soluciones.
1. El despliegue inicial es un dolor de cabeza
Los retos empiezan justo en el momento de la implementación. La instalación de estos sistemas puede parecer un poco como intentar resolver un problema relacionado con el Premio del Milenio. El hardware es una combinación complicada de cajas de computación, cajas de almacenamiento, estructura de conmutación y muchos cables. A pesar de ser «agnósticas del hardware», estas soluciones tienen en realidad un conjunto limitado de componentes específicos de determinados «proveedores certificados o cualificados». Con toda esta variedad, la configuración inicial es compleja, con variaciones entre componentes, y muchas veces las organizaciones tardan semanas de trabajo con ingenieros formados por proveedores en poner el sistema en funcionamiento.
Lamentablemente, el tiempo hasta la primera I/O es solo el principio.
Si bien estas nuevas soluciones de almacenamiento afirman tener muchas funcionalidades, muchas de ellas se basan en diversos software de código abierto. Muchas de estas características no están preparadas para la empresa y su configuración correcta demuestra ser compleja. Algunas de estas características clave están desactivadas de manera predeterminada, lo que provoca quebraderos de cabeza operativos en el futuro. Por ejemplo, un proveedor desactiva el cifrado de datos en reposo (D@RE) de manera predeterminada, lo que es crucial para mantener seguros los datos de los clientes. Si bien D@RE puede habilitarse después de que el sistema esté en funcionamiento, esto puede afectar al rendimiento continuo de manera imprevisible, lo que puede incluso hacer que un sistema no cumpla sus acuerdos de nivel de servicio de rendimiento. Las unidades de autocifrado (SED) pueden minimizar el impacto en el rendimiento del sistema durante el cifrado, pero tienden a ser mucho más caras que las unidades normales. A diferencia de lo que los resultados de referencia de rendimiento de este proveedor con cifrado desactivado pueden transmitir, los clientes que despliegan esta solución deben elegir entre aceptar un impacto en el rendimiento o pagar costes adicionales para adquirir SED.
2. Las operaciones diarias son difíciles
Lamentablemente, el funcionamiento de estas nuevas soluciones de almacenamiento no es más fácil una vez que se completa el despliegue inicial. Los clientes tienen que estar atentos para garantizar que su sistema de almacenamiento funciona de manera óptima. Esto significa que hay que hacer frente a una variedad de parches de terceros e incluso a correcciones de software personalizadas, lo que puede aumentar los tiempos de inactividad y los riesgos y ampliar los tiempos de resolución. Muchas tienen capacidades de supervisión limitadas que proporcionan cierta información reactiva sobre la cabina y las estadísticas de usuario y las alertas de error, pero no pueden detectar problemas automáticamente, ofrecer soluciones de autoservicio o prever requisitos futuros.
Estas nuevas soluciones de almacenamiento muestran todos los problemas distintivos de SDS con el cumplimiento de los objetivos de rendimiento, fiabilidad, eficiencia y escalamiento. En teoría, puede escalar los nodos de computación y almacenamiento de manera independiente en diferentes cantidades según sea necesario. En realidad, los nodos de computación y almacenamiento se escalan juntos, lo que a menudo conduce al sobreaprovisionamiento de recursos y al equilibrio de cargas de trabajo. Incluso cuando se escalan como se sugiere, estas soluciones a menudo no proporcionan un rendimiento constante en todos los escenarios, especialmente con I/O pequeñas. A medida que los clústeres se escalan y se vuelven asimétricos, hay aún más posibilidades de imprevisibilidad y desequilibrio en el rendimiento.
No es de extrañar que algunos de estos nuevos proveedores de almacenamiento tengan que ocultarse bajo el disfraz de un canal de Slack dedicado y asignar expertos en ingeniería dedicados para proporcionar un soporte continuo para cada una de sus instalaciones. Si bien entendemos la necesidad de estos esfuerzos equivocados para ocultar su inestabilidad y complejidad, no beneficia a los clientes a largo plazo.
3. Las ramificaciones a largo plazo pueden ser graves
Estas soluciones de almacenamiento basadas en SDS añaden un riesgo imprevisto a los entornos de almacenamiento de sus clientes, tanto desde el punto de vista del hardware como del software. Desde el punto de vista del software, estas startups de almacenamiento reclaman un conjunto de características enriquecido y un soporte todo incluido. Muchas de estas características están incluidas incluso en el momento de la compra sin ningún coste adicional, pero con un descargo de responsabilidad de que las características existentes o futuras pueden licenciarse por separado. Desde el punto de vista del hardware, hemos hablado de la complejidad de desplegar varios componentes especializados. Algunos de estos componentes ya han demostrado no ser viables en el mercado a largo plazo e impactan en la capacidad de una organización para proteger su inversión al escalar y aprovechar su arquitectura a largo plazo. Las actualizaciones a gran escala y las migraciones mayoristas son dolorosas, por lo que la viabilidad a largo plazo de cualquier arquitectura es esencial.
Aquí tiene un ejemplo: Una solución de almacenamiento SDS específica utiliza la memoria de clase de almacenamiento (SCM) “Optano” en su arquitectura como elemento crítico para el rendimiento. El SCM se utiliza como punto de partida para escrituras, lecturas y metadatos. Con Intel interrumpiendo el programa Optane, la empresa emergente del almacenamiento afirma que la SLC mejorada puede sustituir a SCM sin problemas. La verdad es que la SLC solo tiene un tercio del rendimiento de escritura y una latencia incoherente, lo que afecta negativamente al rendimiento del clúster y añade costes imprevistos. Por último, la arquitectura de red patentada utilizada en estas soluciones SDS hace que el escalamiento sin problemas a grandes capacidades sea complejo y requiera mucho tiempo de funcionamiento.
La simplicidad como principio fundamental
A medida que las cargas de trabajo modernas, como los modelos de lenguaje grande (LLM) y la generación aumentada de recuperación (RAG), ocupan un lugar central, las organizaciones necesitan una plataforma de datos de alto rendimiento, no una solución de almacenamiento que afirme ser una SDS moderna.
En Pure Storage, gestionamos estos retos incorporando la simplicidad en nuestros productos desde el primer día. La plataforma de Pure Storage proporciona un diseño intuitivo y simplicidad durante la configuración, la gestión y la escalabilidad, lo que permite que las organizaciones saquen el máximo partido de sus datos. También ofrecemos una densidad y una eficiencia energética líderes en el sector, impulsadas por la estrecha integración entre nuestro sistema operativo Purity y nuestros Módulos DirectFlash®.
Vaya más allá de las expectativas. Descubra cómo la plataforma de Pure Storage puede preparar su infraestructura para el futuro y aprovechar todo el potencial de sus iniciativas de IA.

Eliminate Complexity
Learn 10 ways Pure Storage helps you uncomplicate data storage, forever.