domingo, 22 de diciembre de 2013

Propósitos para el 2014

Es complicado encontrar un rato durante la semana para poner el freno de mano y pensar en nosotros, en las cosas que hemos hecho, como nos han hecho sentir y que vamos hacer al respecto. Los meses pasan rápido y es por eso que con suerte lo hacemos durante los últimos días de diciembre, antes de que acabe el año.

New Year Sparkle
Para mi el 2011 fue el año en el que pase de la Gestión de Proyectos a la "Artesanía de Sistemas", y desde entonces vivo mejor. Durante el 2012 volví al mundo de la Virtualización (los caminos de la crisis) y me encontré con certificaciones actualizadas de Cisco, Oracle y VMware. No podía seguir viviendo por encima de mis certificaciones y abandoné el mundo Cisco después de 11 años.

El 2013 no sólo ha sido el año del BigData, sino de otras muchas cosas que me obligan a hacer previsiones para el 2014.

Pero esta vez, creo que nos afectan a todos:

Cloud DBA

Hay una clara tendencia a hacer más con menos, automatizar, optimizar, convertirnos en operarios de una linea de montaje de servicios de la información, para conseguir a base de ITIL y similares que seamos hiper-productivos.

Pero luego los departamentos de selección les da por pedir gente con competencias no técnicas, cosas como la innovación o la comunicación que poco tienen que ver con una linea de montaje.

Al resultado de estas discusión la he acabado llamando el camino hacia el Cloud DBA, y no es opcional.

Formación

Durante el 2014 formarse tampoco será una opción.

New Year's Resolution Coasters by Lucky Bee Press
Durante el 2013 además de atender a un MOOC de Data Scientist y asistir a 4 sesiones de introducción a VMware vCO, me he certificado en Oracle 11g, ITIL y MongoDB. Pero toda esta formación tiene un punto en común: ha sido gratuita.

Los exámenes hay que pagarlos, pero creo que es una gran noticia que podamos acceder a formación de calidad de forma gratuita.


Ya no hay excusas para no estar formado...

Big Data

Hace tiempo decidí emprender un experimento en el que tendría que sumergirme en el mundo del BigData, ahora ya se que no es ningún experimento, y no debería serlo para nadie. Las pocas empresas que todavía no ofrecen soluciones para los datos de sus clientes se encontrarán irremediablemente con una pregunta incómoda: "¿y vosotros que tenéis de BigData?".

Necesitamos meditar cual será nuestro siguiente paso en el BigData. Quizás el mio sea ayudar a decidirlo.

The Slow Way

Vivir en el quizás sea el territorio del mundo con más diversidad en menos extensión tiene sus consecuencias. Sin duda un objetivo para el 2014 será SOBREVIVIR ésas consecuencias.

Burbujas. Un buen comienzoSiempre he pensado que esa diversidad se podría vender como un producto. Conseguir convertirla en un reclamo para personas, empresas o incluso países. Pero no.

Yo me creí lo de la Unión Europea, pero curiosamente en Europa pasa algo parecido. Incluso parece que la presidenta de toda Europa es la que gobierna una única región. Quizás es que lo entendí mal.

Puede que la solución sea invertir en los programas espaciales para encontrar vida extraterrestre. Cuando tengamos que competir con otros planetas no nos quedará otro remedio que remar al unísono.

Mientras tanto las alternativas pasan por la apatía, emigrar, provocar o el camino lento...

El camino lento es el de los que no entendemos de blancos o negros, pero si de grises. No se cuantos somos, algunos se pasan a la apatía... unos se radicalizan acabando más blancos o negros que nadie... otros se pasan al rojo o simplemente se van. Es duro verlos caer.

Durante el 2014 no caigas!


Feliz año nuevo

Imagen: New Year Sparkle
Imagen: New Year's Resolution Coasters by Lucky Bee Press
Imagen: Burbujas. Un buen comienzo

lunes, 9 de diciembre de 2013

Software Defined Storage (Flex ASM vs vSAN)

Hace unos días escribí una pequeña disertación sobre el Software Defined Storage intentando poner en relieve que ya hay existen multitud de capas de SOFTWARE en el camino que hacen nuestros datos desde la controladora hasta el disco.

Pero si SDS está en boca de todos es por el intento de varios fabricantes de hacernos olvidar la gestión del almacenamiento. Para conseguirlo será necesario crear una capa de abstracción.

Capas

layers
Imagina una capa de SOFTWARE que gestione nuestro almacenamiento entre varios nodos de un cluter, utilizando la red para la señalización y bloqueos o incluso para enviarse bloques de datos. Que además pretenda abstraernos de temas físicos y que con sólo decirle lo que necesitamos ya se preocupará de dónde.

Imagina también que ese lugar donde guardará los datos, no será cualquier lugar. Se preocupará de la disponibilidad replicando nuestros datos según  convenga y se adaptará al rendimiento según las necesidades del servicio en cada momento.

¿Suena bien? 


Pues aquí presento no una, sino dos capas de SOFTWARE que cumplen con la descripción que hemos imaginado:

Flex ASM (el PDF)

Tal y como explicaba en mi anterior post, Oracle se adelantó a su tiempo con Exadata, y creo que con ASM también logró. Oracle presentó su capa de abstracción de almacenamiento con la base de datos 10g en el año 2003, se llamaba Automatic Storage Management (ASM).

Esta capa consiste en una instancia de base de datos Oracle dedicada a gestionar discos, y lo hace bastante bien. Balanceo de carga, añadir y quitar discos en caliente, gestionar replicas, uso compartido entre varios nodos de cluster... operaciones ligadas a una limitación: debemos tener una instancia de ASM en cada nodo de la base de datos. Hasta 12c

Con Oracle 12c se presenta Flex ASM, donde definiremos un numero mínimo de instancias de ASM y Oracle se encargará de mantenerlo. En el caso de que la instancia de ASM se caiga, la base de datos se conectará a otra instancia de ASM por un segmento de red dedicado. El servicio de base de datos no caerá y el cluster iniciará otra instancia de ASM en otro nodo.

Todavía no lo he probado pero me parece una característica de disponibilidad impresionante que junto a los Heat Maps y el Tiering conforman un producto llamado Automátic Data Optimization, y parte de la estrategia Cloud de Oracle.

vSAN (el PDF)

Todavía en fase beta, vSAN se presento en la pasada VMworld 2013. Se trata de la evolución de VSA donde olvidamos el Appliance y trabajamos con un módulo del kernel. En este caso hay que destacar que los discos SSD ya no son una opción, sin dos tiers de disco (SSD y mecánicos) no podrás usar vSAN.

Este cambio les ha llevado a abandonar los perfiles de almacenamiento para pasar a políticas (SBPM). Puede sonar a lo mismo, pero lograr una gestión de concurrencia en disco no parece tan sencillo como con la CPU o la memoria, que menos que un par de intentos. 

Dos Diferencias

#9: difference La principal diferencia es que ASM requiere almacenamiento compartido entre todos los nodos del cluster (si es que montamos un cluster RAC) y vSAN trabaja con almacenamiento local. Con vSAN lograr disponer de almacenamiento compartido (virtual SAN) sin disponer de la costosa infraestructura que conlleva.

Usar  almacenamiento local y volver a equipos independientes huyendo de los blades y SAN es una tendencia muy interesante. Vivir una época donde no nos podemos permitir inversiones iniciales disparatadas convierte el escalado a base de Commodity Servers en una opción muy apetecible y el salto a 10GB en las redes lo ha puesto fácil.

En los últimos años se ha vivido algo parecido con las bases de datos, donde todas las tecnologías relacionadas con el BigData van en esa dirección: grandes granjas de Commodity Servers y comunicación por red.

Otra diferencia es la gestión del rendimiento, mientras con vSAN las políticas las definiremos nosotros y los cambios serán manuales, ASM pretende adaptarse a las necesidades de cada momento para cualquier dato de la instancia.

Este ultimo punto es una de las críticas de Multitenant en 12c, ya que muchas características son globales a la instancia cuando en realidad se vende una separación entre PDBs.

Aunque sobre este tema tendré que hablar otro día.

Imagen: layers
Imagen: #9 difference

miércoles, 4 de diciembre de 2013

Software Defined Storage

Creo que la primera vez que vi Software Defined Storage en acción fue en el año 2000, cuando me tocó gestionar algunos equipo UNIX y descubrí los gestores de volúmenes de AIX.

En los últimos 13 años las cosas han cambiado y los Arquitectos de Sistemas están de enhorabuena: se puede elegir. Puede elegir entre varias opciones para adaptarse a las necesidades del cliente y la coyuntura (también llamada crisis) escogiendo entre una gran variedad de opciones.

Muchas de estas opciones son las que nos harán decidir entre una u otra cabina de discos ( EMC vs HP vs NetApp ). Y si es lo que buscas, te recomiendo esta guía de compra y dejar de leer. 

No se trata tanto de saber que es el SDS, sino de saber elegir la mejor opción.

Escojamos un Disco

Storage
Una de las opciones más llamativas es SANsymphony de DataCore, una empresa de SOFTWARE con la que montar un metro-cluster de storage activo-activo parecerá de lo más normal del mundo. Pero con esta solución además nos independizarnos del fabricante en futuras renovaciones de plataforma. La primera vez que lo vi me pareció ciencia ficción.



Curiosamente una de las críticas que los competidores de NetApp alegaban eran problemas de rendimiento. Decían que aunque ofrecían funcionalidades impresionantes (deduplicación, gestión avanzada de snapshots, ...) con una solución basada en SOFTWARE (el Sistema Operativo Data ONTAP de NetApp) era imposible dar el mismo rendimiento que con sus soluciones Hardware.

Ahora esos mismo fabricantes han añadido a su portfolio soluciones en la linea de DataCore, como los VPLEX de EMC o los V-Series y MetroCluster de NetApp. Dicen que es de sabios rectificar.

EMC Blueprint:  Software-Defined Storage

No hay que olvidar que las cabinas de discos actuales no sólo se limitan a servir LUNs, un buen ejemplo es la API de VMware VAAI, un servicio SOFTWARE que tendremos que asegurarnos de no perder antes de poner una capa sobre nuestro almacenamiento.

Del Disco Al Servidor

Del disco al servidor va un cable, ¿no? ¿Qué pinta aquí el software?

Si estamos diseñando un CPD tendremos que decidir si queremos converger las redes de datos y de almacenamiento. Una decisión muy relacionada con el SDN, veamos si hay señales que ayuden a responder...

Hard Disk Rack (showing power and IDE connections)
Los primeros fueron Cisco con Nexus, equipos que podemos encontrar:

Una solución, que particularmente también me gusta, son los Virtual Connect de HP. Bajo una APARIENCIA DE HARDWARE nos encontramos con toda una capa de abstracción donde podemos dividir cada conexión de 10GB del servidor en combinaciones de puertos de red y almacenamiento FC over Ethernet de la velocidad que más nos convenga. 



Toda una tendencia que se consolida con el soporte de SR-IOV en las tarjetas de interconexión y por los fabricantes como VMware.

Esto último no es estrictamente SOFTWARE, pero me cuesta llamar hardware a un elemento con puertos virtualizables en sub-puertos convertibles en red o SAN a gusto del consumidor y con soporte para iSCSI (protocolo sobre Ethernet) integrado como guinda del pastel.

A Oracle se le Quedó Pequeño

A partir de la versión 10g, es posible instalar un SOFTWARE gestor de volúmenes de disco propio de Oracle: ASM. Pero en el 2009 sacó al mercado Exadata, la avanzadilla de sus Engineered Systems, con los que intenta hacer rentable la compra Sun.

De repente los 4-8 GB de SAN se le quedaban cortos y que su estándar sería InfiniBand de hasta 40G, y además los discos SSD dejaban de ser una opción para convertirse en una obligación.

Pero la auténtica revolución de Exadata fue el Storage Server, un SOFTWARE que al igual que DataCore se anticipó a su tiempo:

Smart Scan Smart Flash Cache Hybrid Columnar Compression




No contentos con eso, hace tiempo que nos enviaron otra señal añadiendo el cliente de Direct NFS, para acceder al almacenamiento por Ethernet, directamente en los binarios de la base de datos.

Conclusión

El mercado todavía esta reaccionando al impresionante avance de Exadata.

Por por fin usar disco SSD empieza a ser la norma, aparecen tecnologías de deduplicación en cabina de discos comparables a HCC y creo haber visto a un par de técnicos analizando el rendimiento de un proceso MapReduce en Hadoop frente a Smart Scan. Una competencia que traerá muchos beneficios a los usuarios.

Poner capas de SOFTWARE o utilizar Ethernet para acceder al almacenamiento ha dejado de ser un tema tabú y ha paso a ser una norma, las mejoras en rendimiento, flexibilidad, disponibilidad e incluso ahorro de costes superan a los porcentajes ínfimos de rendimiento que puedan llegar a perderse y permite a los fabricantes ofrecer muchas más opciones. Así que...

si eres un Arquitecto de Sistemas

ENHORABUENA!




PD: Para los que se hayan quedado con ganas de SDS, lo siguiente que escribiré en el blog será: "vSAN vs Flex ASM", aunque en realidad no tengan mucho que ver... ;)


Imagen: Storage
Imagen: EMC Blueprint: Software-Defined Storage
Imagen: Hard Disk Rack (showing power and IDE connections)