¿Cómo se compara el equivalente de dióxido de carbono incorporado de Flash con los discos duros?

Algunos están promocionando la compra de sistemas basados en HDD basados en CO2e, pero una comparación del CO2e de los HDD COTS con las SSD no es así de corta y seca. Aquí tiene por qué y qué debería ver en su lugar.


Resumen

Embodied carbon dioxide equivalent (CO2e) is a sustainability metric that can be used when evaluating enterprise storage systems’ impact on the environment. When you conduct a system-level comparison, flash-based systems can have a notably lower CO2e than HDD-based systems.

image_pdfimage_print

Recientemente ha habido varios artículos web y publicaciones de blog que comparan el equivalente de dióxido de carbono incorporado (CO2e) de las unidades de disco duro (HDD) estándar (COTS) frente a los discos de estado sólido (SSD). Si toma esas comparaciones como valor nominal, es muy probable que se vaya creyendo que, en esta métrica de sostenibilidad, las SSD son hasta 8 veces peores que las HDD, con la sugerencia implícita de que la creación de sistemas de almacenamiento a partir del flash es mucho peor para el medio ambiente que la creación con un disco giratorio. Sin embargo, si nos fijamos en los datos de CO2e más recientes de los discos duros y las unidades de estado sólido, ese número está mucho más cerca y, en función de los dispositivos flash que compare, puede ser menos del doble por terabyte (TB). 

Después de actualizar las comparaciones a nivel de dispositivo con las cifras actuales, realizamos una comparación a nivel de sistema que muestra claramente que los sistemas basados en flash pueden tener un CO2e notablemente menor que los sistemas basados en HDD, dependiendo de qué proveedores se utilicen para la comparación. También he validado por qué usar comparaciones a nivel de dispositivo en lugar de a nivel de sistema para plantear argumentos de sostenibilidad sobre los sistemas de almacenamiento empresarial es extremadamente engañoso. 

Cómo llegar a una referencia equivalente actualizada de dióxido de carbono incorporado  

Un estudio de la Universidad de Wisconsin comparó las unidades de disco duro y las unidades de estado sólido COTS fabricadas en 2017, comparando el dióxido de carbono incorporado por terabyte (CO2e/TB) durante la fabricación de una unidad de HDD de nivel de consumo de 1TB y una unidad de estado sólido de nivel de consumo de 1TB. El estudio mostró unas emisiones incorporadas de 20 kg de CO2e/TB para la HDD y 160 kg de CO2e/TB para la unidad de estado sólido, ¡una diferencia de 8 veces! Utilizando datos publicados de proveedores de unidades SSD para unidades empresariales fabricadas en 2021, comparé una unidad de disco HDD Seagate Exos X20 de 18TB con un CO2e/TB de 1,2 kg con una unidad de estado sólido Seagate Nytro 3332 de 15TB con un CO2e/TB de 2,91 kg. En lugar de una diferencia de 8 veces, la SSD tenía un contenido de carbono incorporado de solo 2,4 veces el de la HDD comparable.

Si nos fijamos en las tendencias del sector desde 2017, no hay duda de que las emisiones por TB de fabricación de la SSD han disminuido rápidamente (casi 10 veces desde 2017), mientras que al mismo tiempo, la densidad de la SSD aumenta más rápidamente que la densidad de la HDD. La tabla de la Figura 1 a continuación se ha extraído del Informe de sostenibilidad del ejercicio fiscal de 2022 de Western Digital, página 43, y muestra la ratio media de intensidad de las emisiones de gases de efecto invernadero (GEI) en todos los discos duros y SSD fabricados por el proveedor durante años sucesivos. Las ratios de intensidad de las emisiones de GEI para las unidades de disco duro y las unidades de estado sólido por TB vendidas en 2020 mostraron que las unidades de estado sólido eran 2,5 veces más altas (4,3/1,7), pero está claro que cada año posterior las unidades de estado sólido estaban mejorando mucho más que las unidades de estado sólido. En 2022, los datos mostraron que la ratio de intensidad de las emisiones de GEI de la SSD por TB había caído un 49% hasta 2,2, mientras que la ratio de intensidad de las emisiones de GEI de la HDD había caído solo un 29% hasta 1,2, lo que muestra que las SSD solo eran 1,83 veces más altas (2,2/1,2) en la intensidad de las emisiones de GEI en ese año. 

flash
Figura 1. Una comparación de la ratio de intensidad de las emisiones de GEI de los discos duros y las unidades de estado sólido en el FY22 publicada por Western Digital.

Pero no deberíamos pararnos ahí. ¿Y el impacto de los ciclos de vida de los dispositivos sobre el CO2e? La mayoría de los proveedores de unidades de HDD ofrecen una garantía de entre dos y cinco años, mientras que los proveedores de unidades de estado sólido ofrecen de manera uniforme cinco años. Backblaze, una empresa independiente de almacenamiento en la nube y copia de seguridad de datos que publica cifras de fiabilidad de los dispositivos de almacenamiento basadas en un estudio de cientos de miles de dispositivos que se ejecutan en sus propios laboratorios y que se inició en 2013, realiza un seguimiento de los fallos de las HDD y las unidades de estado sólido en las pruebas que se ejecutan continuamente. Los datos más recientes de Backblaze muestran que las unidades de disco duro fallan aproximadamente un 50% más a menudo que las unidades de estado sólido y, de esos fallos de HDD con seguimiento, la edad media de fallo es de 2 años y 10 meses. Tenga en cuenta que si una SSD dura 1,83 veces más que una HDD, ha logrado un CO2e equivalente y la probabilidad de que esto ocurra es bastante buena en los entornos empresariales. 

Basándose en esto, está claro que las SSD están mucho más cerca de las HDD en cuanto a la intensidad de las emisiones de GEI por TB y la disparidad que aún existe puede verse compensada por el ciclo de vida más largo de las SSD. Y la brecha de carbono por TB incorporada entre las unidades de disco duro en comparación con las unidades de estado sólido seguirá estrechando en el futuro a medida que mejoren las eficiencias de la fabricación flash y las instalaciones de fabricación aprovechen fuentes de generación de energía más ecológicas. 

¿Las comparaciones a nivel de dispositivo son incluso relevantes para el almacenamiento empresarial?

He comentado otras comparaciones entre HDD y SSD que han utilizado comparaciones a nivel de dispositivo en el pasado —en concreto, aquellas que han mostrado que las HDD tienen un coste mucho menor de $/GB por capacidad bruta—. Si está tratando de realizar comparaciones entre ordenadores, como ordenadores portátiles, que probablemente solo tengan un dispositivo de almacenamiento integrado, tal vez funcione una comparación a nivel de dispositivo. Sin embargo, los sistemas de almacenamiento empresarial suelen tener cientos o miles de dispositivos de almacenamiento y la dinámica de comparación es muy diferente en esos tipos de entornos. Iría hasta el punto de decir que usar comparaciones a nivel de dispositivo para argumentar la sostenibilidad de los sistemas de almacenamiento empresarial es extremadamente engañoso. 

He tratado estos argumentos en profundidad en otras publicaciones, pero resumiré aquí por qué las comparaciones a nivel de dispositivo son tan engañosas para el almacenamiento empresarial. Para realizar una comparación relevante de los sistemas de almacenamiento empresarial, tiene que establecer un objetivo de requisitos de rendimiento y capacidad para el sistema y luego desarrollar el sistema que pueda cumplir ese requisito usando HDD o SSD. Luego tiene que tener en cuenta el ahorro de capacidad con flash que se acumula de una conversión de capacidad bruta a utilizable más alta (mayor utilización de la capacidad, codificación de borrado más eficiente). Debido al rendimiento y las densidades significativamente mayores y a las mayores ratios de conversión de capacidad bruta a utilizable de las unidades de estado sólido, acaba necesitando muchas menos unidades de estado sólido que las unidades de disco duro, lo que también significa que necesita mucha menos infraestructura de soporte (controladores, armarios, ventiladores, fuentes de alimentación, infraestructura de conmutación), lo que genera un mayor coste, consumo energético, emisiones de carbono y residuos electrónicos al final de la vida útil de un producto. 

Tenga en cuenta que el rendimiento mucho mejor de las unidades de estado sólido significa que puede usar dispositivos mucho más grandes y, al mismo tiempo, cumplir los objetivos de rendimiento y tiempo de reconstrucción del disco, y puede usar tecnologías de reducción del almacenamiento, como la deduplicación, que funcionan en tiempo real para aumentar aún más la capacidad efectiva de las unidades de estado sólido. 

La Figura 2 muestra una comparación de los sistemas creados para satisfacer un requisito de 4 petabytes usando discos duros de 12TB y tres opciones diferentes de dispositivo flash ( SSD de 15,36 TB, SSD de 30,72 TB, DFM de 75TB)1. Para crear la Figura 2, usé las ratios de intensidad de las emisiones de GEI del FY222 para el disco giratorio y el flash para el FY22 de la Figura 1. Las emisiones de CO2e y de fase de uso se utilizan indistintamente según la convención. Verá que, basándose solo en el CO2e de los dispositivos de almacenamiento, el sistema basado en SSD es solo 1,84 veces más alto (no el 8x que se ha implícito en artículos recientes). Esta comparación rápida no tiene en cuenta los componentes adicionales y los armarios necesarios para el sistema basado en HDD (todos los cuales se suman a su CO2e). [Note that I added in two 1U switches for the networking in each system type to get to the rack space requirement.] 

Comparación de Flash con HDD
Figura 2. Una comparación rápida del recuento de dispositivos de almacenamiento y el CO2e para los sistemas de almacenamiento empresariales que utilizan diferentes tipos de dispositivos.

No quiero entrar en una comparación detallada del consumo energético del ciclo de vida en este blog, pero me gustaría destacar que los sistemas basados en SSD pueden consumir mucha menos energía que los sistemas basados en HDD comparables. Una HDD de 12TB consume aproximadamente 6 vatios de uso medio, lo que genera un TB/vatio de 2,0. Una SSD de 30,72 TB consume entre 9 y 13 vatios, en función del nivel de actividad. Si usamos una suposición de 11 vatios, esa SSD produce un TB/vatio de 2,8, aproximadamente un 40% más que la HDD. Para la comparación de la Figura 2, el consumo energético de solo los dispositivos del sistema basado en HDD es de 2052 vatios, comparado con los 1474 vatios del sistema basado en SSD de 30,72 TB. Es aún más baja para el sistema basado en el Módulo DirectFlash® (DFM) de 75TB de Pure Storage. Nuestros DFM consumen 10 vatios, tienen un TB/vatio de 7,5 y generarían un consumo energético de 550 vatios en el ejemplo que se muestra en la Figura 2 —un 75% más bajo que el del sistema basado en HDD—. El tema de otro blog será una comparación más completa del consumo energético, pero está claro que cuando se trata del consumo energético y de sus sistemas asociados basados en el flash de CO2e, pueden ofrecer grandes ventajas sobre los sistemas basados en HDD.

¿Y ahora qué pasa con los residuos electrónicos? Si utilizamos la comparación de 10 años que se muestra en la Figura 2 para las unidades de disco duro de 12TB y las unidades de estado sólido de 30,72 TB, tiene 2,55 unidades de disco duro que desechar. Suponemos que tanto las unidades de disco duro como las unidades de estado sólido funcionan con un ciclo de vida de cinco años en los sistemas (que puede ser generoso para las unidades de disco duro). Por lo tanto, al final de los 10 años, habría eliminado 684 unidades de disco duro, pero solo 267 unidades de estado sólido de 30,72 TB (por no hablar de tener que comprar y desechar todos los controladores, armarios, ventiladores, fuentes de alimentación e infraestructura de conmutación adicionales que necesitaría para las unidades de disco duro).

Emisiones de fase de uso a nivel de sistema 

Veamos de nuevo las emisiones totales de las fases de uso para las opciones de disco giratorio y basadas en flash. El Informe de Sostenibilidad FY22 de Western Digital muestra que la HDD media tiene unas emisiones de fase de uso 1,2 veces más altas que la SSD media. En la Figura 3, he comparado la infraestructura basada en HDD usando HDD de 22TB con una infraestructura basada en DFM de Pure Storage usando los DFM de 150TB que se enviarán a finales de 2024 para una implementación de 1 exabyte2 en 10 años. Supongo que hay un ciclo de vida de 5 años para las unidades de disco duro (que puede ser generoso) y un ciclo de vida de 10 años para los DFM (que está demostrado por las propias tasas de fallos anuales internos de Pure Storage [AFRs] y los registros de seguimiento de la resistencia). Por lo tanto, para los fines de la Figura 3, asumimos que el equipo basado en HDD debe comprarse dos veces durante el periodo de 10 años, mientras que el equipo basado en DFM solo debe comprarse una vez. Verá que la configuración basada en HDD tiene un ciclo de vida total de CO2e que es 7,3 veces mayor que la configuración basada en DFM.

flash
Figura 3. Comparación de CO2e entre un despliegue basado en HDD de 1EB y un despliegue basado en DFM de 1EB durante un periodo de 10 años. 

Cualquier cambio en la comparación, en función del tamaño de los dispositivos que pueda usar, sin dejar de cumplir el rendimiento, el tiempo de reconstrucción del disco y otros requisitos, pero está claro que si puede usar dispositivos más grandes, necesitará muchos menos de ellos. En particular, cuando se trata de sistemas basados en HDD, muchas empresas eligen tamaños de dispositivo más pequeños para abordar las preocupaciones relacionadas con la reconstrucción y el rendimiento general del sistema, por lo que las comparaciones más realistas pueden usar HDD de 10TB u 8TB, lo que reduce aún más la brecha inicial de CO2e entre los sistemas basados en SSD y HDD. Por otro lado, si los requisitos de rendimiento y tiempo de reconstrucción son muy laxos, podría usar discos duros más grandes. Actualmente, las unidades de disco duro de 24TB están bastante disponibles y, en los próximos años, es posible que veamos que las unidades de disco duro de 30TB pasan a la producción por volumen. Por supuesto, esto aumentaría la brecha inicial de CO2e entre las SSD y las HDD. 

Módulos DirectFlash de Pure Storage  

Permítame hablarle aquí de los Módulos DirectFlash (DFM) de Pure Storage®. Hace casi una década, decidimos que era necesario crear el sistema basado en flash más eficiente en el que no podíamos confiar las SSD COTS —tendríamos que crear nuestros propios dispositivos3. Sin restricciones por los límites de la tecnología de empaquetado SFF de 2,5”, ya hemos demostrado que podemos crear dispositivos flash de gran capacidad que no solo son totalmente utilizables en los sistemas empresariales, sino que además proporcionan un rendimiento más constante, un mejor uso de la capacidad y tienen una densidad, fiabilidad, resistencia y eficiencia energética mucho mayores que las SSD COTS. Si bien los proveedores de discos a menudo implican un ciclo de vida de 10 años para sus SSD, en realidad solo proporcionan garantías en el rango de cinco años. Nuestra garantía de los DFM coincide con nuestros supuestos de análisis del ciclo de vida —10 años. Y nuestros DFM cuestan menos en dólares/TB que las SSD COTS.

Hemos estado enviando nuestros DFM de 75TB desde 2023 y los he incluido en la Figura 2. Puede ver que nuestras densidades de DFM más altas dan como resultado unos sistemas mucho más compactos que necesitan muchos menos dispositivos, menos infraestructura de soporte y espacio en bastidor, consumen mucha menos energía y permiten sistemas a gran escala que realmente pueden empezar con un CO2e más bajo que los sistemas basados en HDD comparables (dependiendo de las capacidades de dispositivo seleccionadas). Enviaremos un DFM de 150TB para finales de 2024 y tenemos planes de introducir un DFM de 300TB para 2026. Esos DFM de mayor capacidad serán muy atractivos para crear sistemas multi-PB, mientras que conservaremos DFM de menor capacidad (que también estamos enviando actualmente) para usarlos con nuestros sistemas más pequeños. 

No olvide la fiabilidad

Hay una diferencia significativa en cuanto a fiabilidad entre las unidades de disco duro y las unidades de estado sólido. En el último lanzamiento de Backblaze en mayo de 2024, muestran unas AFR de HDD medias del 1,41 %. Las últimas AFR de SSD Backblaze publicadas disponibles son del 0,96%. Los administradores del almacenamiento saben por experiencia que la AFR aumenta a medida que las unidades de disco duro envejecen. Sí, los proveedores sustituirán los dispositivos defectuosos que siguen en garantía, pero el hecho es que con los sistemas basados en HDD, los administradores dedican más tiempo a sustituir los dispositivos defectuosos y a reconstruir los datos debido a los fallos de la unidad. Además, el hecho de que el fabricante los sustituya o no no significa que el dispositivo de sustitución no tenga ningún impacto de CO2e —algo contrario—. Cada dispositivo sustituido añade cada vez más carbono incorporado al total del sistema.

Por cierto, los Módulos DirectFlash de Pure Storage son mucho más fiables incluso que las SSD. Nuestra AFR es del 0,12%, demostrada en cientos de miles de DFM que hemos enviado en sistemas desde 2017 — ¡eso es 8 veces mejor que las últimas AFR de las SSD COTS!

Entonces, ¿cuál es el CO2e adicional en el que se incurre debido a una tasa de fallos del dispositivo más alta? La Figura 4 utiliza los supuestos de la Figura 3 comparando un sistema 1EB creado a partir de discos duros de 22TB frente a 150TB de DFM durante un ciclo de vida de 10 años para mostrar que el sistema basado en HDD incurre en un CO2e adicional de los dispositivos de sustitución de 169 224 kg, mientras que el sistema basado en DFM solo incurre en 26 400 kg adicionales, una diferencia de más de 6 veces. Esta adición marca una diferencia sustancial cuando se añade al CO2e global de cada sistema (los sistemas basados en HDD y DFM).  

Comparación de Flash con HDD
Figura 4. CO2e adicional incurrido para la configuración de 1EB debido a fallos del dispositivo.

Conclusión

Por lo tanto, está claro que los argumentos que tratan de fomentar la compra de sistemas basados en HDD para uso empresarial basados en CO2e realmente no se desvían si observa todo el sistema a lo largo de su ciclo de vida. La mejora de las eficiencias de la fabricación flash ya ha reducido la brecha inicial de CO2e entre las unidades de disco duro y las unidades de estado sólido a nivel de dispositivo a menos del doble, y eso solo seguirá disminuyendo a medida que la relación de intensidad de las emisiones de GEI de las unidades de estado sólido disminuya más rápidamente que en las unidades de estado sólido. Y si tiene en cuenta la vida útil, eso reduce (y a veces) cualquier diferencia de CO2e. Si utiliza los sistemas de almacenamiento de Pure Storage y evalúa el CO2e durante toda la vida útil de un sistema de almacenamiento empresarial —que diría firmemente que es la manera correcta de evaluarlo—, es cierto que los sistemas totalmente flash pueden tener un menor impacto de carbono incorporado que los sistemas basados en HDD.  

Las soluciones de Pure Storage superan de manera constante a los sistemas basados en HDD en una amplia gama de métricas a nivel de sistema: rendimiento global y coherencia del rendimiento, uso de la capacidad, densidad, fiabilidad, resistencia, coste/TB, eficiencia energética y ciclo de vida. Los artículos recientes que desafían las ventajas del CO2e para las unidades de disco duro frente al flash trataban de dar a los clientes empresariales razones para seguir comprando nuevos sistemas basados en unidades de HDD, pero este análisis muestra que los sistemas construidos con unidades de estado sólido tienen un ciclo de vida del CO2e mucho más cercano al de los sistemas basados en unidades de HDD de lo que las comparaciones a nivel de dispositivo sugerirían. Y los sistemas de almacenamiento a gran escala construidos con los DFM de Pure Storage tienen un contenido de carbono incorporado más bajo no solo en su ciclo de vida de 10 años, sino también en la compra inicial. Así que, una vez más, al igual que con el coste/TB, las SSD COTS aún no proporcionan capacidades que amenacen un evento de nivel de extinción para las HDD, pero los DFM lo son claramente.

 1 El Módulo DirectFlash (DFM) de 75TB es un dispositivo de almacenamiento flash creado específicamente por Pure Storage para uso empresarial. 
 2 Esto se basa en los planes actuales de Pure Storage. 
 3 En 2017 entregamos nuestros primeros DFM.