La reciente falla de Amazon Web Services (AWS) debido a una tormenta, que dejó sitios como los de Netflix, Pinterest e Instagram inaccesibles, es la última de una serie de costosas fallas de la nube. Desde 2007, un total de 568 horas de caídas de 13 importantes proveedores de servicios cloud tuvieron un impacto económico de $71,700 millones de dólares, de acuerdo con el Group on Cloud Computing Resiliency (IWGCR).
El tiempo de caída promedio ha sido de 7.5 horas al año, a decir del IWGCR, una tasa de disponibilidad de 99.9 por ciento debajo de la confiabilidad requerida para sistemas de misión crítica. “Los servicios de nube baratos pueden salir caros”, señaló Kevin C. Taylor, socio del departamento de servicios de la firma de abogados Schnader, Harrison, Segal & Lewis.
Si bien el contrato de nube típico contiene cláusulas de funcionamiento y créditos para los niveles de servicio no cumplidos, a menudo no logra proteger adecuadamente al cliente empresarial. Los créditos del acuerdo de nivel de servicio (SLA), que normalmente encabezan una parte de las cuotas mensuales de servicio, “no compensan las pérdidas asociadas con la caída de una aplicación de producción”, explica Taylor. “Incluso en un caso extremo de fallas continuas y severas las cantidades de créditos serían irrisorias – digamos $20 mil dólares – en comparación con el impacto al cliente, que podría ser de millones”.
Pero existen preguntas que un cliente inteligente puede hacer para asegurarse que están protegidos contra las amenazas potenciales de la nube.
1. ¿Los SLA de disponibilidad satisfacen mis necesidades?
Los compradores acostumbrados a los cinco nueves (99.999 por ciento de disponibilidad) se sentirán desilusionados por los SLA de 99.9 por ciento de los proveedores cloud. “Es uno de los primeros términos por el que deben preguntar a su proveedor prospecto para ver si pueden mejorarlo”, asegura Jim Slaby, director de investigación de estrategias de riesgo y seguridad de HfS Research. “Los compradores también deben negociar objetivos bien definidos en cuanto a los puntos de recuperación y tiempo de recuperación para cada servicio de su contrato”. Usted tendrá que pagar más. La configuración de servicio activo-activo típica requerida para ofrecer una confiabilidad de 99.999 por ciento puede añadir hasta 50 por ciento a los costos mensuales del servicio, apunta Slaby.
2. ¿Cómo define usted “disponibilidad” y “caída”?
“Los clientes sofisticados definirán con claridad lo que consideran una caída”, señala Todd A. Fisher, socio de la firma de abogados K&L Gates. “¿Significa que cinco por ciento de los usuarios finales son afectados? ¿O 25 por ciento? ¿O 50 por ciento? ¿Y si el sistema está funcionando técnicamente, pero está corriendo tan lentamente que los usuarios finales no pueden hacer su trabajo eficientemente?
Muchos proveedores de servicios en la nube también incluyen una lista de exclusiones de las garantías de disponibilidad, incluyendo situaciones de emergencia, apagones de 15 minutos o menos, y disponibilidad durante ciertas horas del día. “Los compradores deben esperar ventanas de exclusión pequeñas pero bien definidas que no cuentan como una caída para que el proveedor pueda llevar a cabo el mantenimiento de rutina”, agrega.
Cuidado con las exclusiones demasiado altas. Por ejemplo, las caídas de las telecomunicaciones normalmente se excluyen sin distinción entre los servicios comprados por el cliente mismo (una exclusión legítima) y aquellos del proveedor que deberían ofrecer una arquitectura de telecomunicaciones redundante para prevenir un solo punto de falla, dice el Dr. Jonathan Shaw, director de la consultora de outsourcing Pace Harmon. “Puede usted ver exclusiones por ‘mantenimiento de emergencia’ sin limitaciones cuándo puede el proveedor llamar a una emergencia por mantenimiento, lo que les exenta totalmente por una caída”, señala Shaw.
3. ¿Y los “Actos de Dios?
La mayoría de los contratos cloud tampoco incluyen las causas de fuerza mayor – aquellos fuera del control razonable del proveedor como los desastres naturales, la guerra, y las huelgas. “Una causa de fuerza mayor puede permitir que un proveedor no cumpla sus compromisos, incluyendo los SLAs”, indica Taylor de Schnaders. “Los clientes deben negociar una definición específica de fuerza mayor”.
4. ¿Qué tan estable es su entorno de nube?
Shaw de Pace Harmon recomienda a los clientes realizar una debida diligencia en cualquier solución de nube para estimar el riesgo de caídas importantes. Vea cómo está estructurada la nube. ¿Hay un centro de datos en una zona sísmica o en un país propenso a la inestabilidad política?
5. ¿Cuál es su plan de recuperación de desastres?
“Los compradores deberían estar averiguando esto”, señala Slaby de HfS Research. Pida visitar el site y consultar las auditorías para estimar el tiempo de recuperación y el punto de recuperación del proveedor y use esa información para calcular el impacto de una falla potencial en su negocio. “Este análisis puede simplemente excluir una solución de nube [si] no es posible recuperar la aplicación cloud lo suficientemente rápido para evitar un evento que ponga en riesgo el negocio”, añade Shaw.
6. ¿Con qué frecuencia pone a prueba ese plan?
“Tener un plan de recuperación de desastres y de continuidad no asegura que la caída se minimizará en caso de un desastre”, apunta Fisher de K&L Gates. “Por desgracia, algunos proveedores no prueban regularmente su plan de modo que no pueden estar seguros de que será efectivo en caso de un desastre”. Los compradores inteligentes incluirán un requerimiento contractual de pruebas de recuperación de desastres semestral, urgiendo al proveedor a revelar los resultados al cliente y corregir cualquier deficiencia descubierta.
7. ¿Cuáles son las mejores opciones de implementación?
La caída más reciente de AWS ocurrió sólo en instalaciones específicas ubicadas en la costa oriental de Estados Unidos. En consecuencia, algunos clientes la resintieron de forma importante, mientras que otros no sufrieron los efectos. “Un factor importante de esta diferencia fue cómo los clientes habían implementado sus aplicaciones de nube”, explica Shaw. AWS permite a los clientes implementar componentes de nube (procesamiento, almacenamiento, bases de datos) en diferentes balanceadores de carga elástica (ELBs) en zonas de disponibilidad para dirigir el tráfico. “Incluso los clientes pueden eliminar el punto único de falla al implementar varios ELBs en diferentes zonas de disponibilidad y usar búsquedas del sistema de nombres de dominio para brindar failover”, añade Shaw.
8. Si algo sale mal, ¿puedo saltar al frente de la fila?
En caso de desastre, un proveedor se las verá duras para que cientos, si no es que miles, de clientes vuelvan a estar en línea. “Si es realmente importante estar al frente de la fila, usted debe considerar pagar extra para tener un trato preferencial”, asegura Fisher.
9. ¿Puedo irme si no estoy satisfecho?
Los clientes deben insistir en una cláusula que les dé el derecho de terminar sin penalidades si el proveedor no puede restaurar el servicio después de un periodo determinado sin importar la causa de la caída, señala Slaby. “Lo peor que puede pasar es tener el compromiso de pagar durante varios años por un servicio que no se está ofreciendo”, dice Shaw.
10. ¿Puedo ver sus libros de contabilidad?
Los actos de Dios, las fallas del software y un tráfico pesado no son los únicos riesgos de un servicio cloud confiable. El negocio mismo puede fallar. “Si el proveedor de nube se declara en bancarrota y simplemente dejará de prestar el servicio, el SLA no le garantiza nada”, afirma Shaw. “De modo que se recomienda hacer una investigación financiera y un análisis del negocio”.