lunes, 9 de diciembre de 2013

Software Defined Storage (Flex ASM vs vSAN)

Hace unos días escribí una pequeña disertación sobre el Software Defined Storage intentando poner en relieve que ya hay existen multitud de capas de SOFTWARE en el camino que hacen nuestros datos desde la controladora hasta el disco.

Pero si SDS está en boca de todos es por el intento de varios fabricantes de hacernos olvidar la gestión del almacenamiento. Para conseguirlo será necesario crear una capa de abstracción.

Capas

layers
Imagina una capa de SOFTWARE que gestione nuestro almacenamiento entre varios nodos de un cluter, utilizando la red para la señalización y bloqueos o incluso para enviarse bloques de datos. Que además pretenda abstraernos de temas físicos y que con sólo decirle lo que necesitamos ya se preocupará de dónde.

Imagina también que ese lugar donde guardará los datos, no será cualquier lugar. Se preocupará de la disponibilidad replicando nuestros datos según  convenga y se adaptará al rendimiento según las necesidades del servicio en cada momento.

¿Suena bien? 


Pues aquí presento no una, sino dos capas de SOFTWARE que cumplen con la descripción que hemos imaginado:

Flex ASM (el PDF)

Tal y como explicaba en mi anterior post, Oracle se adelantó a su tiempo con Exadata, y creo que con ASM también logró. Oracle presentó su capa de abstracción de almacenamiento con la base de datos 10g en el año 2003, se llamaba Automatic Storage Management (ASM).

Esta capa consiste en una instancia de base de datos Oracle dedicada a gestionar discos, y lo hace bastante bien. Balanceo de carga, añadir y quitar discos en caliente, gestionar replicas, uso compartido entre varios nodos de cluster... operaciones ligadas a una limitación: debemos tener una instancia de ASM en cada nodo de la base de datos. Hasta 12c

Con Oracle 12c se presenta Flex ASM, donde definiremos un numero mínimo de instancias de ASM y Oracle se encargará de mantenerlo. En el caso de que la instancia de ASM se caiga, la base de datos se conectará a otra instancia de ASM por un segmento de red dedicado. El servicio de base de datos no caerá y el cluster iniciará otra instancia de ASM en otro nodo.

Todavía no lo he probado pero me parece una característica de disponibilidad impresionante que junto a los Heat Maps y el Tiering conforman un producto llamado Automátic Data Optimization, y parte de la estrategia Cloud de Oracle.

vSAN (el PDF)

Todavía en fase beta, vSAN se presento en la pasada VMworld 2013. Se trata de la evolución de VSA donde olvidamos el Appliance y trabajamos con un módulo del kernel. En este caso hay que destacar que los discos SSD ya no son una opción, sin dos tiers de disco (SSD y mecánicos) no podrás usar vSAN.

Este cambio les ha llevado a abandonar los perfiles de almacenamiento para pasar a políticas (SBPM). Puede sonar a lo mismo, pero lograr una gestión de concurrencia en disco no parece tan sencillo como con la CPU o la memoria, que menos que un par de intentos. 

Dos Diferencias

#9: difference La principal diferencia es que ASM requiere almacenamiento compartido entre todos los nodos del cluster (si es que montamos un cluster RAC) y vSAN trabaja con almacenamiento local. Con vSAN lograr disponer de almacenamiento compartido (virtual SAN) sin disponer de la costosa infraestructura que conlleva.

Usar  almacenamiento local y volver a equipos independientes huyendo de los blades y SAN es una tendencia muy interesante. Vivir una época donde no nos podemos permitir inversiones iniciales disparatadas convierte el escalado a base de Commodity Servers en una opción muy apetecible y el salto a 10GB en las redes lo ha puesto fácil.

En los últimos años se ha vivido algo parecido con las bases de datos, donde todas las tecnologías relacionadas con el BigData van en esa dirección: grandes granjas de Commodity Servers y comunicación por red.

Otra diferencia es la gestión del rendimiento, mientras con vSAN las políticas las definiremos nosotros y los cambios serán manuales, ASM pretende adaptarse a las necesidades de cada momento para cualquier dato de la instancia.

Este ultimo punto es una de las críticas de Multitenant en 12c, ya que muchas características son globales a la instancia cuando en realidad se vende una separación entre PDBs.

Aunque sobre este tema tendré que hablar otro día.

Imagen: layers
Imagen: #9 difference

2 comentarios:

Sebastián Greco dijo...

Hola Héctor!

De esto del vSAN lo que más me sorprende es ver el peso que tiene VMware a la hora de marcar tendencias.

Como bien dices, lo de la virtualización de storage no es nuevo pero hasta que no se empezó a ver lo del "Software Defined Datacenter" que presenta VMWare realmente no era muy común escucharlo. Me encuentro ahora con clientes que me sacan el tema de SDD! :)

Hay cosas que me intriga ver cómo irán. Lo de VASA no parecía una buena solución y de hecho creo que no lo era si se pretendía cobrar por ella...parecía más bien un primer paso a algo más grande que gente como D. Epping anunciaban (vSAN). No estoy seguro que vSAN sea el producto final que VMware pretende sacar al mercado porque se deja de lado integrar el storage local con las cabinas y crear una capa de abstracción para TODO el storage de nuestro CPD (además de que le faltan funcionalidades "de toda la vida" del storage). Pero bueno, tiempo al tiempo que esto todavía está en beta :)

Creo que más de uno nos preguntamos ¿Cómo reaccionan a esto los fabricantes de storage? Y los de soluciones software como la neonata PernixData o el mismísimo Datacore?

Un abrazo,
Sebas

hmartinezlopez dijo...

No creo que vSAN sea un producto para TODO.

Pero si para los que no quieran invertir en una SAN convencional. Quizás por eso no encuentras todas las funcionalidades que buscas... "las de toda la vida", para eso compra una EMC (que para algo son los dueños de VMware).

En realidad lo que están haciendo es copando el mercado y luchando contra Nutanix y soluciones parecidas, no contra la SAN de toda la vida.

Además, es la solución para virtualizar BigData... ya que la recomendación para Hadoop o NoSQL es no utilizar discos compartidos.


Una gran jugada de VMware a mi parecer.



Gracias por todo Sebas!

PD: Ya no podré explicar nada sobre este tema hasta PROBARLO! Y lo de que todavía esté en Beta me llama muuuucho.

=D