Resumen
New startup storage solutions are promising SDS-like benefits with extensive features, simple operations, and unlimited scale. But the complex initial implementations and ongoing stability challenges tell a different story.
Esta es la parte 3 de una serie de cinco partes que analiza las afirmaciones de las nuevas plataformas de almacenamiento de datos. Lea la Parte 1 y la Parte 2.
Durante más de una década, el almacenamiento definido por software (SDS) afirmó ser una alternativa atractiva para el almacenamiento de datos empresariales costoso y complejo. Entre sus afirmaciones, se encuentran la flexibilidad inigualable, la independencia del hardware y el ahorro de costos del hardware básico.
Desafortunadamente, las implementaciones del mundo real resultaron poco prácticas. Incluso las nubes públicas que inicialmente construyeron su infraestructura sobre componentes de hardware básico se dieron cuenta de que las eficiencias a escala solo podían lograrse a partir de la ingeniería de hardware y software juntos.
Avance rápido hasta la actualidad, y muchas soluciones de almacenamiento nuevas y no comprobadas para empresas emergentes se están comercializando como “solo software” y “independientes de hardware”, beneficios prometedores similares a SDS con amplias funciones, operaciones simples y escalabilidad ilimitada. Dicho esto, ¿puede ser cierto?
La moda: Nuevas soluciones de SDS, la misma complejidad antigua
Las empresas emergentes basadas en SDS prometen soluciones de almacenamiento sin interrupciones, pero están marchitas con implementaciones iniciales complejas, desafíos de estabilidad continuos y arrepentimiento. Más específicamente, la implementación de estos sistemas a menudo resulta en la resolución de problemas, la aplicación de parches y la experimentación sin interrupciones con diferentes configuraciones de almacenamiento, lo que provoca frustración y pérdida de recursos valiosos.
Estas soluciones de SDS también luchan contra las ineficiencias. Los componentes de los productos básicos son atractivos debido a su bajo costo de adquisición; sin embargo, la falta de optimización y eficiencia entre el hardware y el software aparece en la eficiencia energética de estos sistemas. Con el mundo al borde de una crisis energética, cada vatio ahorrado es un vatio que se puede aprovisionar a nuevas cargas de trabajo. Y con el aumento de las inversiones en AI, ¡estos vatios serán valiosos! Veamos algunas de las cargas duraderas de la administración del almacenamiento que tienden a seguir la implementación de estas soluciones.
1. La implementación inicial es un dolor de cabeza
Los desafíos comienzan justo en la implementación. Instalar estos sistemas puede parecerse un poco a intentar resolver un problema con el Premio del Milenio. El hardware es una combinación complicada de cajas de procesamiento, cajas de almacenamiento, estructura de conmutación y muchos cables. A pesar de las afirmaciones de ser “agnósticas al hardware”, estas soluciones en realidad tienen un conjunto limitado de componentes específicos de “proveedores certificados o calificados” selectos. Con toda esta variedad, la configuración inicial es compleja, con variación entre componentes, lo que a menudo lleva semanas a las organizaciones de trabajar con ingenieros capacitados por proveedores para que el sistema funcione.
Lamentablemente, el tiempo hasta la primera I/O es solo el comienzo.
Si bien estas nuevas soluciones de almacenamiento afirman ser ricas en funciones, muchas funciones provienen de varios software de código abierto. Muchas de estas funciones no están listas para la empresa y su configuración correcta demuestra ser compleja. Algunas de estas funciones clave están desactivadas de forma predeterminada, lo que provoca dolores de cabeza operativos en el futuro. Por ejemplo, un proveedor desactiva la encriptación de datos en reposo (D@RE) de forma predeterminada, lo cual es fundamental para mantener seguros los datos del cliente. Si bien D@RE puede habilitarse después de que el sistema esté en funcionamiento, esto puede afectar el rendimiento continuo de manera impredecible, tal vez incluso resultando en que un sistema no pueda cumplir con sus SLA de rendimiento. Las unidades de autoencriptación (SED) pueden minimizar el impacto en el rendimiento del sistema durante la encriptación, pero tienden a ser significativamente más costosas que las unidades regulares. A diferencia de lo que el punto de referencia de rendimiento de este proveedor con cifrado desactivado puede transmitir, los clientes que implementan esta solución deben elegir entre aceptar un impacto en el rendimiento o pagar costos adicionales para adquirir SED.
2. Las operaciones diarias son desafiantes
Desafortunadamente, operar estas nuevas soluciones de almacenamiento no es más fácil después de completar la implementación inicial. Los clientes deben permanecer atentos para garantizar que su sistema de almacenamiento funcione de manera óptima. Eso significa lidiar con una variedad de parches de terceros e incluso correcciones de software personalizadas, lo que puede aumentar el tiempo de inactividad y el riesgo, y extender los tiempos de resolución. Muchas tienen capacidades de monitoreo limitadas que proporcionan cierta información reactiva sobre la matriz y las estadísticas del usuario y las alertas de error, pero no pueden detectar problemas automáticamente, ofrecer soluciones de autoservicio ni predecir requisitos futuros.
Estas nuevas soluciones de almacenamiento muestran todos los problemas distintivos de SDS con el cumplimiento de los objetivos de rendimiento, confiabilidad, eficiencia y escalabilidad. En teoría, puede escalar nodos de procesamiento y almacenamiento de forma independiente en diferentes cantidades según sea necesario. En realidad, los nodos de procesamiento y almacenamiento se escalan juntos, lo que a menudo lleva al aprovisionamiento excesivo de recursos y al equilibrio de cargas de trabajo. Incluso cuando se escalan según lo sugerido, estas soluciones a menudo no ofrecen un rendimiento consistente en todos los escenarios, particularmente con I/O pequeñas. A medida que los clústeres escalan y se vuelven asimétricos, hay aún más posibilidades de imprevisibilidad y desequilibrio en el rendimiento.
No es de extrañar que algunos de estos nuevos proveedores de almacenamiento tengan que ocultarse bajo la apariencia de un canal Slack dedicado y asignar expertos en ingeniería dedicados para proporcionar asistencia continua para cada una de sus instalaciones. Si bien entendemos la necesidad de estos esfuerzos erróneos para ocultar su inestabilidad y complejidad, no beneficia a los clientes a largo plazo.
3. Las ramificaciones a largo plazo pueden ser graves
Estas soluciones de almacenamiento basadas en SDS agregan un riesgo imprevisto a los entornos de almacenamiento de sus clientes, tanto desde una perspectiva de hardware como de software. Desde una perspectiva de software, estas empresas emergentes de almacenamiento afirman contar con un conjunto de funciones enriquecido y asistencia integral. Muchas de estas funciones incluso se incluyen en el momento de la compra sin costo adicional, pero con una exención de responsabilidad de que las funciones existentes o futuras pueden obtener una licencia por separado. Desde una perspectiva de hardware, analizamos la complejidad de implementar varios componentes especializados. Algunos de estos componentes ya han demostrado no ser viables en el mercado a largo plazo e impactan en la capacidad de una organización para proteger su inversión al escalar y aprovechar su arquitectura a largo plazo. Las actualizaciones de montacargas y las migraciones mayoristas son dolorosas, por lo que la viabilidad a largo plazo de cualquier arquitectura es esencial.
Este es un ejemplo: Una solución de almacenamiento SDS específica utiliza la memoria de clase de almacenamiento (SCM) “Optano” en su arquitectura como un facilitador crítico del rendimiento. El SCM se utiliza como punto de aterrizaje para escrituras, lecturas y metadatos. Con Intel interrumpiendo el programa Optane, la empresa emergente de almacenamiento afirma que la SLC mejorada puede reemplazar a SCM sin problemas. La verdad es que SLC solo tiene un tercio del rendimiento de escritura y la latencia inconsistente, lo que afecta negativamente el rendimiento del clúster y agrega costos imprevistos. Por último, la arquitectura de red patentada que se utiliza en estas soluciones de SDS hace que escalar sin problemas a grandes capacidades sea complejo y lleve mucho tiempo operar.
Simplicidad como principio central
A medida que las cargas de trabajo modernas, como los modelos de lenguaje grande (LLM) y la generación aumentada de recuperación (RAG), ocupan un lugar central, las organizaciones necesitan una plataforma de datos de alto rendimiento, no una solución de almacenamiento que afirme ser una SDS moderna.
En Pure Storage, manejamos estos desafíos mediante la simplicidad de la ingeniería en nuestros productos desde el primer día. La plataforma de Pure Storage ofrece un diseño intuitivo y simplicidad durante la configuración, la administración y la escalabilidad, lo que permite a las organizaciones aprovechar al máximo sus datos. También ofrecemos densidad líder en la industria y eficiencia energética impulsada por la estrecha integración entre nuestro sistema operativo Purity y nuestros módulos DirectFlash®.
Vaya más allá de la publicidad. Descubra cómo la plataforma de Pure Storage puede preparar su infraestructura para el futuro y liberar todo el potencial de sus iniciativas de AI.

Eliminate Complexity
Learn 10 ways Pure Storage helps you uncomplicate data storage, forever.