ThousandEyes ha publicado la tercera edición del informe sobre el rendimiento de la nube, en el que examinamos y comparamos los datos de rendimiento y las arquitecturas de conectividad de los tres principales proveedores de nube pública: Amazon Web Services (AWS), Microsoft Azure y Google Cloud. El informe sobre el rendimiento de la nube ofrece una comparación basada en mediciones y un análisis basado en métricas y asignaciones de red recopiladas durante un periodo de tres años; además, proporciona una visión agnóstica del rendimiento y los comportamientos de los principales proveedores de nube pública.
El consumo de la nube ha seguido acelerándose exponencialmente desde que se publicó la anterior edición de este informe en 2019. Las cargas de trabajo basadas en la nube admiten una enorme variedad de servicios digitales en la actualidad y, cuando se producen degradaciones del rendimiento, los efectos dominó pueden afectar a más servicios y dependencias de servicios que hasta ahora. La visibilidad es el ingrediente esencial para ayudar a los equipos de operaciones de TI (ITOps) a comprender cuándo, por qué y dónde se degrada el servicio en un mundo de aplicaciones cada vez más distribuidas, centradas en la API y dependientes de la nube. Los datos del informe sobre el rendimiento de la nube pretenden, por tanto, ayudar a las empresas a obtener visibilidad específica de sus propias implementaciones y dependencias en la nube; no buscan recomendar un proveedor en vez de otro.
En resumen, los equipos de TI pueden tomar mejores decisiones sobre la nube si comprenden los detalles del comportamiento y las anomalías de la red del proveedor de la nube.
El informe sobre el rendimiento de la nube arroja luz sobre el modo en que los proveedores gestionan sus redes y sobre cómo es el buen (y "no tan bueno") rendimiento de éstas, lo que ayuda a responder a preguntas estratégicas y tácticas fundamentales, como:
- ¿Qué puntos de visibilidad me ayudarán a saber de qué rendimiento y calidad dispongo con mis servicios en la nube?
- ¿Cómo puedo planificar con confianza la implementación de pilas de aplicaciones resistentes basadas en la nube?
- ¿Cómo puedo optimizar mis aplicaciones teniendo en cuenta la conectividad y los comportamientos específicos de mi proveedor?
- ¿Qué preguntas debo hacerle a mi proveedor de la nube para que me ayude a conseguir un buen rendimiento y a crecer según mis necesidades?
Estado de la situación actual de la nube
Los servicios en la nube se han convertido en algo omnipresente para las empresas de hoy en día y las redes de nube pública son una pieza fundamental de su infraestructura diaria. Las empresas han adoptado ampliamente el SaaS empresarial, lo que añade capas adicionales de complejidad para los equipos de operaciones de TI que solucionan los problemas. Esta compleja red de interdependencias puede ponerles las cosas difíciles a los equipos de TI que se encargan de establecer estrategias de evaluación, monitorización y optimización fiables y específicas para sus propias aplicaciones. Otro factor es la considerable centralización en el uso de servicios en la nube. Cuando se produce una interrupción de suministro en la nube, ésta puede tener repercusiones de gran alcance y afectar a muchas personas. Y, sin embargo, puede ser extremadamente difícil para los equipos de operaciones de TI o de ingenieros de fiabilidad del sitio (SRE) localizar la causa de manera eficiente. Para complicar aún más las cosas, las organizaciones utilizan con frecuencia varias nubes públicas o una combinación de nubes públicas y privadas.
Los arquitectos de TI deben saber qué pueden esperar de su proveedor de la nube. Dado que ningún proveedor es inmune a las anomalías, la pregunta sigue siendo la siguiente: ¿dónde existen estas anomalías de rendimiento y por qué? La típica implementación actual de servicios digitales modulares y distribuidos basados en la nube requiere conocer el comportamiento y la conectividad desde muchos ángulos diferentes. Los arquitectos necesitan conocer siempre las respuestas a preguntas como:
- ¿Cómo es la conectividad de red del proveedor de la nube y cómo se comporta en mi caso?
- ¿Qué relación tiene mi proveedor con otros proveedores de la nube y de tránsito?
- ¿Qué tal lo hace mi proveedor entre sus regiones de la nube y entre sus zonas de disponibilidad?
Conclusiones del informe
A continuación presentamos algunos de los aspectos más destacados, cuya información detallada se puede encontrar en el informe sobre el rendimiento de la nube.
Conclusión 1: las decisiones de arquitectura de conectividad que toman los proveedores de la nube pueden tener repercusiones operativas y de rendimiento para sus clientes. Se dieron variaciones en las arquitecturas de conectividad entre los tres principales proveedores de la nube. Esto incluye diferencias en la forma en que se anuncian los terminales del servicio, se ocultan las rutas subyacentes y se aprovecha la infraestructura compartida para la red troncal. Estas diferencias pueden tener repercusiones significativas para sus clientes.
Conclusión 2: las regiones de la nube de los mercados maduros gozan de un buen rendimiento de la red troncal, mientras que otras regiones del mundo, como Asia, experimentaron más problemas. Los tres proveedores han realizado notables optimizaciones en el rendimiento de su red troncal desde 2019, aunque seguimos observando importantes variaciones en la latencia.
Conclusión 3: todos los proveedores de la nube experimentan problemas de rendimiento con el tráfico procedente de los usuarios de China continental. Esto se debe al impacto en el rendimiento que supone atravesar el gran firewall de China, que provoca la pérdida de paquetes y una mayor latencia. Hong Kong sigue pareciendo estar fuera del gran firewall de China, aunque la pérdida de paquetes hacia Hong Kong aumentó significativamente a partir de 2021.
Conclusión 4: el rendimiento entre zonas de disponibilidad fue muy bueno para los tres proveedores; la mayoría de las regiones mostraron una latencia muy por debajo del umbral deseado de 2 milisegundos. Cabe destacar que algunos proveedores se situaron por debajo de ese umbral de latencia de forma más sistemática que otros.
Conclusión 5: el tráfico que fluye entre los principales proveedores de la nube se suele gestionar directamente, sin pasar por Internet. Esta conclusión pone de manifiesto lo bien conectados que están los principales proveedores de la nube entre sí y cómo, en algunos casos, el rendimiento de nube a nube rivalizó con el rendimiento dentro de la nube en regiones de ubicación similar.
Lea el informe sobre el rendimiento de la nube para obtener más información.
Arquitectura para el rendimiento en la nube
El rendimiento de la nube es importante porque los diseños de las aplicaciones actuales dependen en gran medida de ella. Las pilas de aplicaciones modulares han convertido la baja latencia en algo imprescindible. La nube está en el centro de la red de interdependencias de aplicaciones distribuidas, los microservicios y las API de SaaS que impulsan los servicios digitales. Además, los arquitectos se esfuerzan por diseñar servicios de alta disponibilidad, resistentes y rentables. Los objetivos de alta disponibilidad impulsan pilas de aplicaciones de carga equilibrada de varias instancias, diseños de replicación de datos georredundantes y arquitecturas de varias regiones.
Por tanto, el rendimiento de la red en la nube no se mide con una sola métrica, sino examinando varios puntos de datos diferentes recogidos desde varias perspectivas. La conectividad entre regiones, por ejemplo, puede experimentar grandes variaciones en función de la métrica, el proveedor y la geografía de la red. Conocer el rendimiento de las interconexiones pertinentes es primordial a la hora de planificar la implementación de nuevas aplicaciones.
El conjunto de datos utilizado en el informe sobre el rendimiento de la nube incluye métricas de pérdida, latencia, fluctuación, MTU y datos de topología de ruta directa e inversa para mediciones del usuario final, entre regiones, entre zonas de disponibilidad y multinube. Estas cuatro categorías de mediciones comprenden los diferentes casos de uso que afectan a los consumidores y operadores de aplicaciones basadas en la nube.
Mediciones del usuario final
El Internet público puede desempeñar un papel importante en el rendimiento de las aplicaciones basadas en la nube. Las mediciones del usuario final están diseñadas para brindar a los clientes de servicios de plataformas e IaaS en la nube información sobre cómo se conectan las diferentes ubicaciones de los proveedores de la nube al Internet más amplio y cómo funcionan las rutas de extremo a extremo en diferentes ubicaciones.
Los arquitectos que implementan nuevos servicios tendrán preguntas que pueden resolverse con esta visibilidad, como por ejemplo: ¿cuánto tiempo permanece el tráfico en el Internet público antes de entrar en la red del proveedor de la nube? ¿Afectan las rutas de Internet más largas al rendimiento general? Los proveedores de la nube mejoran constantemente sus redes troncales y su emparejamiento, pero existen diferencias regionales de rendimiento entre los principales proveedores de la nube. Conocer estos detalles puede ayudar a tomar decisiones acertadas sobre la planificación y la implementación de las aplicaciones.
Mediciones de varias zonas
El informe recoge mediciones entre zonas de disponibilidad (AZ) de los tres proveedores de nube analizados. La arquitectura de aplicaciones en la nube de varias zonas suele utilizarse para la resistencia. Los arquitectos de aplicaciones suelen implementar sus pilas de aplicaciones en diseños altamente redundantes y con equilibrio de carga divididos en diferentes zonas de disponibilidad física. Si una de las zonas de disponibilidad sufre un fallo, la aplicación puede seguir estando disponible. Por ejemplo, un diseño de aplicación activo-activo típico puede incluir varias instancias de la misma pila de aplicaciones divididas en diferentes zonas de disponibilidad, con sincronización de datos en tiempo real entre las instancias. En este escenario, cada milisegundo cuenta, porque la latencia puede acumularse en el transcurso de una sesión de aplicación.
Los proveedores suelen esforzarse por conseguir tiempos de respuesta inferiores a 2 milisegundos entre zonas, pero puede haber variabilidad. Los datos de ThousandEyes se utilizaron para medir el número y la naturaleza de dicha variabilidad o las anomalías de cada proveedor de la nube analizado. La variabilidad se observó no solo en las cifras de latencia en sí, sino también en características como la frecuencia y la duración.
Mediciones de varias regiones
Las arquitecturas de aplicaciones de varias regiones se utilizan principalmente por cuestiones de latencia. En otras palabras, la implementación de aplicaciones y contenidos más cerca del usuario mejora la experiencia de este con esa aplicación. Al diseñar los servicios de backend más cerca de los servicios de frontend y sincronizar los datos entre las regiones, se puede reducir la latencia de la aplicación.
Puede haber otras razones por las que las organizaciones decidan utilizar la conectividad multirregional más allá de los casos de uso técnico. Por ejemplo, puede haber un requisito para implementar módulos de aplicaciones redundantes geográficamente o puede haber una necesidad de almacenar datos de clientes en una región geográfica, pero no en otra.
El rendimiento de la red troncal del proveedor de la nube es absolutamente fundamental en estos escenarios. Nuestro análisis reveló que las regiones de la nube de los mercados más maduros experimentaron un rendimiento fiable de la red troncal, mientras que otras regiones (en particular, las de Asia y Oceanía) fueron menos fiables. El análisis de este conjunto de datos reveló que los proveedores de la nube realizaron algunas optimizaciones en diferentes regiones durante el periodo de tres años y que se observan con frecuencia fluctuaciones en la latencia.
Mediciones multinube
Las aplicaciones de hoy en día a menudo dependen de varias nubes públicas o privadas, ya sea por diseño intencionado o como resultado de las dependencias de servicios de terceros en diferentes redes de proveedores de nube. Las aplicaciones que utilizan marcos modulares están centradas en las API, lo que significa que las comunicaciones entre API son una operación típica en el flujo de una aplicación. Si una API de un proveedor de la nube está hablando con una API de otro proveedor de la nube, es importante saber cómo es esa conectividad de red y qué rendimiento tiene.
A la hora de planificar las implementaciones con servicios en la nube, los equipos necesitan saber si un par de proveedores de nube tienen mejor interconectividad que otro para sus ubicaciones específicas o si las latencias interregionales entre los diferentes proveedores satisfacen sus necesidades. Nuestros datos revelan que el tráfico que va de un proveedor de la nube a otro suele transmitirse directamente sin atravesar el Internet público, lo que demuestra lo bien conectados que están los principales proveedores de la nube. Esta interconectividad puede proporcionar ventajas de rendimiento para el tráfico multinube.
Puntos clave
Nuestro análisis de los datos recopilados sobre la nube ha revelado tres ideas clave que los profesionales de la infraestructura y las operaciones (I&O) deben tener en cuenta a la hora de planificar y gestionar las implementaciones y dependencias de la nube.
Los problemas de rendimiento de los servicios en la nube no son infrecuentes. Los proveedores de la nube trabajan constantemente para ampliar su presencia y expandir sus capacidades globales. El mantenimiento periódico es una realidad constante y ningún proveedor es inmune a los problemas. Mientras que las grandes interrupciones de suministro aparecen en los titulares, los problemas de rendimiento y disponibilidad más frecuentes y de menor escala pueden ser difíciles de detectar e identificar, lo que, a su vez, causa un impacto considerable en la experiencia de usuario. Estar preparado para problemas de todos los tamaños debería formar parte de la estrategia de gestión de la nube de todos los equipos.
Los proveedores de la nube gestionan sus redes en función de sus propias prioridades y preferencias. La forma en que un proveedor de la nube diseña y escala su red puede no coincidir con los casos de uso de todos los clientes. Habrá variaciones entre los proveedores en la forma de optimizar y priorizar el tráfico a través de lo que a menudo son redes compartidas. Los responsables de TI deben saber cuál es su posición en relación con estas preferencias y priorizaciones y si podrían verse afectados.
No hay un estado estable en la nube. Las redes en la nube están en constante cambio, ya que los proveedores se esfuerzan por escalar y expandir su infraestructura y añadir nuevas ubicaciones, servicios y conectividades. El rendimiento de una región para un proveedor un año puede ser muy diferente al del año siguiente. Saber que estas redes son dinámicas y están en constante cambio contribuye a la estrategia operativa. Del mismo modo, las instantáneas de rendimiento pueden no reflejar las condiciones actuales, por lo que tener una visibilidad persistente y continua es fundamental.