Google Storage for Developers ya disponible bajo petición

Se rumoreaba que el anuncio del Amazon S3 ‘light’ presentado ayer era pura contraprogramación de Amazon. En el Google I/O 2010, se ha anunciado la disponibilidad del nuevo servicio Google Storage for Developers. Resumiendo, si conoces Amazon S3 o cualquier otro servicio de almacenaje en la nube de objetos, es lo mismo, pero hecho por Google.

Cuando veo la etiqueta ‘for Developers’, me hecho a temblar. ¿Esta coletilla se pone para indicar que el servicio no es lo suficientemente estable para el uso por el público general? ¿O bien porque para aprovechar este servicio hay que tener conocimientos de programación para usar su API REST? No lo se… pero bien la lamentable página de información del producto, me inclino a pensar lo primero. No se a qué  clase de público quieren atraer, pero dado que el servicio es de pago, me parece que deberían cuidar un poco más la presentación del producto. Son Google, no una frikistartup.

Lo que me más me ha extrañado ha sido el precio. Dado que ni están en Beta, debería ser gratis hasta cierto límite. Pero no, de gratis nada. Más aún, es más caro que Amazon S3. Comparemos:

  • Coste por Gigabyte al mes: Google=$0.17 , Amazon=$0.15
  • Coste por Gigabyte de subida de datos: Google=$0.10 , Amazon= $0.1
  • Coste por Gigabyte de bajada de datos: Google Americas y EMEA=$0.15 , Amazon=$0.15
  • 1.000 peticiones PUT, POST, LIST = Google=$0.01 ,  Amazon=$0.01
  • 10.000 peticiones GET, HEAD: Google=$0.01,  Amazon=$0.1

El coste por gigabyte guardado es $0.02 menor en Amazon, pero dado que Amazon ofrece descuentos importantes en función del volumen, esta cifra disminuye en cuando pasamos de los 10TB de almacenamiento.

La verdad es que no veo todavía ninguna razón por la que alguien quisiera migrar de Amazon S3 (o de cualquier otro servicio similar) a Google Storage. No se integra con Google Apps, y por si fuera poco Google no explica cual es su arquitectura de red y sistemas, así que no sabemos si puede tener interés para reducir latencias a la hora de servir datos, por ejemplo. Es decir, nos piden que confiemos a ciegas en un producto más caro, más oscuro e inmaduro.

Quien quiera probar el servicio, debe apuntarse a una lista de espera. Y solo si eres un ciudadano americano podrás hacerlo. Así que si alguien consigue una cuenta y lo prueba, estoy encantado de ofrecerle el blog para que nos cuente la experiencia.

Actualización: Google ha anunciado que los primeros 100GB de almacenamiento y los primeros 300GB de transferencia son gratuitos durante el período de preview.

Sidekick y cómo suicidarte en La Nube

Ha sido una de las noticias más comentadas de los últimos tiempos alrededor del Cloud Computing: Los usuarios de Sidekick, un dispositivo similar a la Blackberry muy popular en los USA han perdido todos sus datos y hay muy pocas posibildades de recuperarlosAcojonante Acongojante.  Sidekick almacenaba los datos en local y en ‘La Nube’, es decir, en almacenamiento en sus Centros Datos donde se suponía que gestionaban los datos de sus usuarios.

La historia de esta empresa es curiosa. Hace cosa de un año Danger fue comprada por Microsoft por unos $500M.  No quiero imaginarme qué puede haber pasado dentro de esta empresa para que ocurra una cosa así. Se supone que Microsoft sabe de servidores y estas cosas…

Los agoreros de la Nube ya han llegado diciendo que lo de la Nube no funciona y todo esto a lo que ya estamos acostumbrados. Sin intentar disculpar a la gente de Danger, creo que la única diferencia entre lo que ha pasado con Danger y cosas que han pasado internamente en las empresas es precisamente la visibilidad. En un servicio público en la Nube, no puedes fallar, ya que tus clientes lo que hacen es confiar en ti. Te contratan tu servicio por confianza. Las críticas a Microsoft y Danger han sido feroces, pero son absolutamente merecidas.

En los últimos años me he encontrado con mucha gente que se centra en dar niveles de disponibilidad de 4, 5 y hasta seis nueves, pero se olvidan de otro tipo de servicios necesarios para el correcto funcionamiento de un sistema que se ejecutan cada semana, mes, cuatrimestre o año. Y son los que suelen fallar. Se ha hablado mucho sobre Sidekick comentando que no tenían redundancia de datos. Me cuesta creer que una empresa que vale tanto dinero no tenga redundancia. Probablemente tendrían procesos mal implementados y que no se probaban con frecuencia (recuerda que se ha perdido TODO, sin posibilidad de recuperar un backup antiguo).

Dentro de los departamentos de IT hay ciertas  ‘líneas rojas’ que son muy peligrosas de cruzar. Una de ellas es restringir el coste de las operaciones de respaldo de datos. Viví una situación en la que una Forbes 500 perdió hasta el 50% de su valor en bolsa por culpa de un recorte desmesurado en el departemento de IT de una subsidiaria que afectó a los sistemas de respaldo. No pudieron recuperar datos, vino un auditor… y ¡ay! los datos no eran correctos en los sistemas por culpa de ese fallo… Y costó miles de millones de dólares a los accionistas. Y recuerdo perfectamente cómo el director de IT puso  su cargo a disposición del CIO cuando le dijeron que debía cruzar esas ‘líneas rojas’ para ahorrar costes. Y se fué, porque sospechaba que podía ocurrir algo como lo que pasó. Ética del trabajo, se llama esto.

No hace falta irse a una Forbes 500, todos conocemos de casos de servidores que llevan meses funcionando, se rearrancan y dejan de funcionar… fuentes de alimentación que fallan cuando se apaga el servidor después de meses de funcionamiento… descubrir con horror que el backup de los datos de tu empresa hace meses que no se hacen y nadie se ha dado cuenta… Y es que los nueves nos ciegan, y no nos acordamos de esas otras tareas que hacen que todo esto gire y funcione.

Esperemos que no me toque nunca algo así.

Cómo construir tu propio sistema de almacenamiento en la Nube: Backblaze Pod

backblaze-cheap-cloud-server-storage2A través de highscalability.com me encuentro con un artículo que puede interesar a todos aquellos que están pensando en dar servicios de Almacenamiento en La Nube (Cloud Storage) y quieren un diseño abierto. La gente de Backblaze.com nos muestran cómo diseñaron y construyeron sus propios appliances para gestionar hasta 67 Teras en un 4U. E incluso te puedes descargar el fichero con el modelo en 3D para que lo puedas encargar.

Backblaze.com es un servicio de backup online, ahora llamado Cloud Storage (sigh!). La información almacenada se mide en Petabytes, por lo que no había nada en el mercado que fuera capaz de dar un precio por gigabyte almacenado alrededor de los 30 céntimos de euro.

Me he ‘apropiado’ de esta interesante tabla mostrando el coste por petabyte entre proveedores:

cost-of-a-petabyte-chartLos datos se han calculado asumiendo un tiempo de amortización de 3 años. Ellos han conseguido un precio por appliance de $7867 (unos 5600€ al cambio actual). Una pasada.

Desde el punto de vista software, lo que han montado es una Debian con JFS y una interfaz web que permite subir y bajar ficheros. Nada muy espectacular en este aspecto. La verdad es que con un monstruo así probablemente les hubiera ido mejor usar ZFS con Opensolaris: la gestión es muy eficiente y compites directamente con el SUN X4550 a nivel de prestaciones, sobre todo por el Thin Provisioning.

Veo en este tipo de productos sinergias con nuestro producto Abicloud: con una arquitectura completamente automatizada, un sistema de almacenamiento para archivado que complemente al NAS SAN de almacenamiento es lo lógico, más que un sistema en cintas, en mi opinión. La sensación de disponibilidad inmediata que dan las infraestructuras como servicios queda mermada por el acceso a las cintas. Lo que no quiere decir que no sea necesario realizar copias de respaldo en cintas, pero de manera transparente al usuario cloud.

Asi que, si alguno se anima a montar algo parecido por aquí, nosotros encantados en probar nuestro software sobre él.

El post completo está aquí.

Los Microsoft Azure SQL Data Services tendrán caracteristicas similares a las de bases de datos relacionales

Interesante noticia sobre la plataforma de Cloud Computing de Microsoft, Azure. Los servicios de acceso a datos en La Nube permitiran ciertas características de las bases de datos relacionales tradicionales. “Pensamos que la base de datos relacional es una tecnología familiar a mucha gente. La gente la entiende y hay gente experimentada a su alrededor. Nos están diciendo que es importante que las habilidades de los desarrolladores sean fácilmente portables a los desarrollos Cloud Computing. También nos indica el tipo de aplicación que se quiere construir en La Nube, y que son bastante más sofisticadas de lo que habíamos pensado inicialmente“, ha dicho Steven Martin, senior director of product management para la plataforma de desarrollo de Microsoft.

Mientras Amazon y Google relajan el modelo relacional hasta hacerlo inexistente, y la mayoría de los sitios web realmente grandes desaconsejan su uso, Microsoft ha detectado que las bases de datos relacionales siguen muy vivas, y está dispuesto a incorporar ‘características similares’ a las de las bases de datos relacionales a sus servicios de gestión de datos en La Nube. ¿Se referirán a integridad referencial? ¿Qué pensáis?.

Parascale, una solución de Almacenamiento en Nubes Privadas competitiva

El mundo de almacenamiento en La Nube anda un poco acelarado ante el inminente (¿o no tan inminente?) lanzamiento por parte de Google de su GDrive. Si a esto le sumamos la agitación alrededor de las Nubes Privadas, tenemos un nuevo concepto muy interesante: Private Storage Clouds o Almacenamiento en Nubes Privadas.

La diferencia frente a los sistemas de almacenamiento empresarial tradicional en las Storage Area Networks (SAN), es el uso de hardware y software commoditiziedcommoditized que permte almacenar grandes cantidades de información con tiempos de acceso muy competitivos (y próximos al de las soluciones en red) con unos costes mucho menores.

En este artículo de Plugintothecloud.com hablan de Parascale. Parascale tiene un producto en beta que teóricamente escala infinitamente (lo han probado hasta con 100 nodos, están en pruebas…) y que se apoya en Linux, el sistema de ficheros XFS y conectividad de red tradicional (sin fibra). El coste por gigabyte es de $1.05, frente a los $2 a $5 de la soluciones SAN. Es decir, muy competitivo.

Las necesidades de almacenamiento de las empresas son cada vez mayores, y en muchos casos una solución SAN no es necesaria. Con costes por gigabyte por debajo del $1 probablemente incluso los sistemas de backup tradicional pueden cuestionarse. El problema de este tipo de soluciones es que, al igual que la mayoría de las soluciones Cloud, aún están en fases muy tempranas, y solo los más valientes pueden arriesgarse. No creo que el CIO de ninguna Fortune 500 se lance a montar una Private Storage Cloud de 50Terabytes con Parascale. Pero el CIO de una startup probablemente vaya de cabeza.

Decho: La nueva marca de EMC para los servicios de Cloud orientados al consumidor

Decho es el nombre de una nueva compañía que EMC ha creado y que se centrará en los Servicios de Información orientados a consumidores. Esta compañía se ha creado gracias a la combinación de dos empresas de EMC, Mozy y Pi. El nombre elegido, Decho, es la combinación de dos palabras: Digital y Echo.

Esta nueva unidad de negocio ofrecerá servicios en La Nube de compartición y almacenaje de información en la Web. Es la combinación de dos negocios, el backup online de Mozy y el manejo de información personal por parte de Pi.

Segun Chuck Hollis, VP y Global Marketing CTO, las razones para Decho son:

Según IDC la cantidad de información creada aumenta un 60% cada año. Pero el 70% de este incremento es información generada por los propios consumidores de manera individual, aunque el 85% de esta información se delegará en alguien para que la guarde de manera segura… La cuestión es ¿qué va a hacer EMC para participar directamente en este cambio de la manera de guardar y gestionar nuestros datos? … Decho es la respuesta para dar servicios basados en Cloud para los consumidores digitales.

Decho será un negocio completamente separado de EMC, un poco al estilo de VMware. Su objetivo es perseguir el mercado del consumidor digital, y para ello pueden seguir su propia estrategia y su propia tecnología. Supongo que esta estrategia está pensada para lanzar una OPV en el futuro, como hicieron con VMware, con mucho éxito por cierto. La base de esta nueva empresa será Mozy, que costó $76 millones de dólares hace un año, y Pi, cuya precio de adquisición no ha sido publicado.

Además, tras la adquisición de Iomega y el lanzamiento de Atmos, parece que la apuesta de EMC por el Cloud es de largo recorrido, y su estrategia parece estar más clara.

EMC Atmos, nueva solución de almacenamiento Cloud Optimized Storage

EMC acaba de anunciar su nueva linea de productos Atmos. Se trata de una solución de infraestructura de almacenamiento (como no podía ser de otra manera viniendo de EMC) en La Nube o Cloud Storage. Este sistema construido sobre hardware commodity permite alcanzar niveles de almacenamiento de hasta 360Petabytes, está dirigido a aquellos que necesitas optimizar la distribución de información rica y no estructurada, permitiendo a proveedores Web 2.0, proveedores de internet, telcos, empresas de media y entretenimiento construir y servir de manera segura servicios de entrega de información basados en La Nube, así como aplicaciones con necesidades de escalado masivo.

EMC ha descrito este producto como Cloud Optimized Storage (COS), que es:

La capacidad de acceder a aplicaciones e información desde un proveedor externo -como una gran compañía de telecomunicaciones- que ha construido a una gran infraestructura en La Nube. Esta infraestructura tendrá ingentes cantidades de información no estructurada en la Web, y requerirá de una política que disperse la información de manera eficiente por todo el mundo.

Algunas características relevantes del producto son:

  • No existe el concepto de Gigabyte o Terabyte, son unidades demasiado pequeñas. Está diseñado para despliegues multi-Petabyte. Solo se manejan objetos y metadata.
  • No es un cluster de sistema de ficheros ni nada parecido. Se ha construido desde cero pensando en las necesidades de La Nube.
  • La información se almacena como objetos. Se aplican políticas sobre estos objetos, permitiendo aplicar diferente funcionalidad y niveles de servicio diferentes tipos de usuarios y datos.
  • Espacio de nombres unificado. No se agrupa la información en silos independientes, sino que hay un único repositorio independientemente del número de Petabytes o cuantos miles de millones de objetos se encuentren distribuidos por cualquier número de lugares e independientemente del número de usuarios.
  • Una única consola de gestión, da igual el número de lugares donde haya repositorios de objetos
  • Es un sistema autónomo que reacciona de manera automática a los cambios en la carga y a los fallos para asegurar la disponibilidad global del sistema.
  • Servicios avanzados de gestión de la información: replicado, versionado, compresión, deduplicación y parada de la rotación de los discos (disk drive spin-down).
  • APIs Web Services REST y SOAP. También es posible usar acceso por fichero.

La solución es tan potente que es posible que los objetos que se usan más frecuentemente tengan más copias en más sitios, y la que es más vieja y/o se acceda con menos frecuencia se encuentra en menos sitios y además comprimida. Es posible también implementar servicios de acceso seguro y de pago-por-uso.

No se ha dado ningún precio al producto, aunque al parecer el precio del producto es bastante inferior a una solución similar basada en NAS, donde el precio por Gigabyte es de docenas de euros. A esto hay que sumar el precio de los Servicios profesionales que pongan en marcha la solución, por supuesto.

Por lo que se, hay Telcos en España que están muy interesadas en ofrecer servicios de almacenamiento virtual masivo al estilo de Amazon S3 o los repositorios de fotos Picassa o Flickr como valor añadido a sus líneas ADSL. Sin embargo, el precio de poner en marcha una solución de este tipo usando tecnología tradicional es absolutamente prohibitivo. Este es el tipo de mercado al que va enfocado este producto de alta gama. Y cuando los usuarios tengamos acceso a este servicio al contratar nuestra línea con ADSL, ya no tendremos que almacenar en nuestros equipos la música y las películas que honradamente hemos comprado, lo haremos en el espacio que pagamos a nuestro operador. Aunque todos los honrados nos perderemos la posibilidad de ejecutar Bittorrent o Emule en una instancia en La Nube alojada en centros de datos al lado de estos repositorios de datos, con velocidades de descarga de gigabytes… ¡Películas en formato Blu-Ray descargadas en menos de un minuto!