martes, 3 de mayo de 2011

Una Mano Ganadora (EMC vs HP vs NetApp)

Me ha tocado estudiar tres de los mejores productos del mercado en lo que a SAN/NAS se refiere: HP EVA 8400, EMC VNX 5700 y NetApp V3200. Yo creía que hacían lo mismo, servir almacenamiento, me equivoqué...



Lo primero: no he evaluado todas las características ni servicios, solo aquellos puntos que me han parecido convenientes. No tengo ninguna vinculación directa con ninguna de las marcas, ni obtengo beneficio alguno al escribir ésto.

Intenté averiguar cuales era los puntos más importantes cuando analizas una cabina de discos, sobretodo con bases de datos Oracle por medio.



No los encontré

Así fue como tuve que empezar de cero, y escogí estos cuatro:
  • Arquitectura
  • Rendimiento
  • Gestión del Espacio
  • Integración
Una vez escogidos los criterios, es sencillo valorar los más importantes para cada situación y tras puntuar cada solución... tendremos nuestra decisión!

Pero antes de puntuar, aclaremos cada punto:

Arquitectura
El almacenamiento supone grandes retos, y cada fabricante los ha abordado a su manera. Y ésto se nota en la arquitectura, punto que te ofrece los problemas o las soluciones para el día a día.

Me centro en dos puntos, con cierta analogía al antiguo Modelo TCP/IP:
  • Presentación, no es lo mismo presentar una LUN de un RAID 5 tradicional (aunque esté contenido en una cabina), que un disco virtual distribuido entre los N discos de una estructura propietaria.
  • Acceso, existe quien necesita o prefiere saber donde esta "ubicada" la información. Tener la certeza de que si mueve esos discos a otro equipo podrá recuperar su información. Pero también estamos los que, confiando en la solución, preferimos las ventajas de una capa de abstracción que modifique el acceso a los discos a cambio de funcionalidades extra y más rendimiento, los cuales no serían posibles de otra forma.
Esto nos lleva a la primera pregunta que debemos hacernos:

¿Me fío de una capa de abstracción propietaria a cambio de grandes promesas de gestión de espacio y rendimiento?

Promise?La critica habitual a los discos virtuales es el rendimiento (y por eso será el siguiente punto a analizar). Luego tocará deslumbrarse por todas las características avanzadas de gestión de espacio que nos ofrecen. Os comento lo que he visto:
  • HP, virtualiza si o si. Una vez agrupados los discos por capacidad y velocidad, presentaremos VDisks a nuestros equipos, discos virtuales enfocados a proporcionar un máximo rendimiento. Balanceo entre todos los discos del grupo (más cabezales = más velocidad), hardware dedicado a operaciones de redundancia.. Incluso parece gestionar los "bloques calientes" (con excesivo I/O).
  • NetApp y EMC utilizan hardware más generalista en las controladoras, gestionadas a su vez por un S.O. optimizado. Disponer de un S.O. permite mucha flexibilidad, no solo dispondremos de funcionalidades extra, sino que en el futuro seguramente podremos actualizarlas y disponer de funcionalidades futuras sin depender del hardware.
  • NetApp además de permitir virtualizar, ofrece una capa de abstracción del almacenamiento físico: WAFL, que decide cuando, como y donde se guardan los bloques de datos. Todas las teorías sobre como se almacena la información o estadísticas de rendimiento no sirven con su solución.
Sobre los discos virtuales comentar que será muy importante la previsión de crecimiento, los límites de los discos virtuales pueden marcar un diseño u otro. Limites en la cantidad de discos en un grupo, límites de tamaño por disco virtual. El que ofrecía menos límites era HP, pero en los nuevos modelos de NetApp parece que han ampliado fronteras a algo bastante competitivo.

Asociado a este problema es conveniente no cambiar de tamaño los discos de un grupo, cuantos más cabezales tenga un grupo mejor, pero si cambiamos el tamaño podemos descompensar la carga. Tenemos que planear las futuras adquisiciones, para formar grupos nuevos de tamaños mayores o acomodarse a un tamaño durante toda la vida de la cabina de discos.

Sobre las controladoras de EMC y NetApp, comentar que me faltó estudiar como afectaba la cantidad de memoria a las soluciones, pero se hace bastante palpable que "el tamaño importa".

Una vez analizado este punto, el resto es pan comido.

Rendimiento
Comparar arquitecturas tan complejas y diferentes no está a mi alcance, es por eso que estudié las opciones de cada fabricante, aunque requerían licencias o hardware adicional.
  • EMC dispone de "tiering" en caliente entre discos SAS, NL-SAS y Flash. Lo llaman FAST, y permite ubicar los bloques "calientes" en los discos más rápidos, mientras los datos "de archivo" se almacenarán en discos más económicos (NL-SAS). Ya he comentado lo mucho que me gusta esta idea, aunque como no me la ofertaron no profundicé.
  • NetApp dispone de una tarjeta aceleradora llamada PAM, actúa como cache de toda la cabina, acelerando toda la actividad, integrándose con su sistema de prioridades (FlexShare) y consiguiendo un pico de rendimiento si utilizamos deduplicación. Tampoco se ofertó.
  • HP no dispone de opciones, aprovecha al máximo su arquitectura de virtualización, dando como única alternativa para obtener más rendimiento adquirir más discos.

Gestión del Espacio
El único punto donde las tecnologías son las mismas entre fabricantes (o casi), contemplé cuatro: virtualización, thin provisioning, deduplicación y compresión.
  • HP implementa por encima de su sistema de virtualización un sistema de seguridad, logrando fallos de hasta dos discos sin impacto. Además de no existir fragmentación por su implementación.
  • EMC engloba virtualización y "thin provisioning" en el producto "Virtual Provisioning". Dispone de herramientas de de-fragmentación y una interfaz completa entre opciones avanzadas y asistentes para ajustar al máximo los discos presentados. También incluye compresión por bloque como un proceso programable.
  • NetApp permite: virtualización, "thin provisioning", compresión y deduplicación. Tanta flexibilidad la permite su arquitectura basada en WAFL. Tanto la compresión como la deduplicación son programables y el problema de la fragmentación "dicen" tenerlo solucionado.

Integración
Todos los sistemas se integran con multitud de productos de terceros, incluido Oracle.
  • NetApp era el fabricante de las cabinas de Oracle (ahora evidentemente es Sun) y no podía quedar sin recompensa. Llegan al extremo de entender las cabeceras de ASM, permitiendo presentar los snapshots/mirrors de discos ASM al mismo equipo donde reside el original.
  • HP tiene una filosofía donde ser sirven LUNs lo mejor posible, por lo que las integraciones son secundarias. Hay muchas criticas a este punto, incluso rumores en los que no entraré. Bajo mi punto de vista, es claramente su punto débil.
  • EMC tiene una gran apuesta con VMware permitiendo el mismo nivel de gestión desde el Navispher de EMC que con el VirtualCenter de VMware, y la flexibilidad que ello conlleva.
Winning Hand
Conclusión
Es evidente que hay otros puntos a tener en cuenta, como el precio ;) también la facilidad de gestión, los conocimientos previos de los técnicos que gestionarán la solución, garantías, soporte, servicios de migración, documentación... Pero son más subjetivos y en el apartado más técnico hay menos dudas.

Pero las tuve, y muchas... y me decidí por la apuesta innovadora de NetApp.

Ganó NetApp, que me prometía una gestión de entornos de desarrollo inmejorable (integración con ASM) consumiendo el mínimo espacio (deduplicación). Todo ello prometiendo el rendimiento de los mejores para mi entorno de producción al que le haría copias de seguridad en cabina olvidándome de RMAN (que conste que no pensaba hacerlo).

Una lástima que en el concurso no solo se valoraba la cabina de discos, Oracle no es el único producto y, evidentemente, yo no era el único que valoraba. Finalmente disfrutaré de una EVA de HP un mínimo de 4 años más...

He de reconocer que tuve ayuda, tanto de los interesados, donde me gustaría destacar a EMC con @jpijuan que colaboró con @avanttic para la integración con Oracle. Y de otros no tan interesados, de los que destaco a @alexis_gil y el ya sabe la razón... sabía incluso por quien me decantaría!

Imagen: storage unit
Imagen: Promise?
Imagen: Wining Hand

1 comentario:

villa dijo...

Hola, mi nombre es Francisco Villalobos y yo instale NetApp, estuve a cargo de la administracion de 3par y netapp y ahora soy arquitecto de Storage NetApp, el ultimo mecionado creo que es una de las mejores alternativas de Storage, para data secuencial NetApp ofrece los E-series y para aleatoria los FAS. Los FAS manejan muchos features de eficiencia y funcionan de maravilla, la unica queja al respecto es la administracion del data ontap que es el sistema operativo que manejan los FAS, el cual para los usuarios finales es mas complicado que el de otras marcas. NetApp es el primero en ser un storage unificado y es el primero en tener la tecnologia snapshot que no perjudica la performance.