Internet es un entorno cada vez más amplio y en constante cambio, del cual dependemos más que nunca para realizar nuestro trabajo. Estar al corriente de las caídas de Internet y de cómo éstas afectan a la experiencia del cliente y del empleado se ha convertido en un requisito imprescindible para las compañías. Hace dos años, introdujimos Internet Insights™ Network Outages, la primera vista global del estado de Internet, que permite a nuestros clientes a reducir de horas a minutos el tiempo que tardan en resolver problemas complejos de los proveedores, gestionar el impacto que las condiciones de la red global tienen en la disponibilidad de sus servicios y comprender la capacidad de rendimiento de sus empleados.
Hoy, develamos la última incorporación al producto Internet Insights: Application Outages, que ofrece a los equipos de operaciones de TI una vista global instantánea de las aplicaciones SaaS disponibles. Sin necesidad de configurar ni un solo test, despliegue o instrumentación, Application Outages los equipos de operaciones de TI disponen de vistas históricas y en tiempo casi real de la disponibilidad de más de 75 de las aplicaciones SaaS más importantes de las que dependen los empleados.
Ahora, los clientes pueden correlacionar rápidamente los problemas específicos de los usuarios con problemas más amplios de las aplicaciones para alertar de forma proactiva a sus empleados en caso de que una aplicación no esté disponible, a la vez que escalan el problema al proveedor de SaaS, normalmente antes de que dicho proveedor reconozca el problema de manera pública. Además, los clientes pueden tomar decisiones más informadas sobre los proveedores y gestionarlos mejor, ya que disponen de su histórico de disponibilidad de aplicaciones.
Vea esta on-demand demo sobre cómo Internet Insights: Application Outages ofrece una visión casi en tiempo real de las caídas que afectan a las aplicaciones que utilizan sus empleados
Pero, ¿con qué frecuencia se producen las caídas de los proveedores para que los equipos de operaciones de TI necesiten este tipo de visibilidad global y constante? La respuesta ess más a menudo de lo que se cree. En 2019, Internet Insights detectó 20 caídas de red al día (en una media de 30 días). En 2020, esa misma media había crecido a 30 caídas al día. Hoy en día, Internet Insights detecta de media más de 50 caídas diarias de red. Estas caídas, a pesar de no aparecer en el ciclo de noticias, siguen costando a los equipos de operaciones un valioso tiempo de resolución de problemas y pueden suponer una pérdida de ingresos para las empresas que dependen de ellas.
Impulsado por inteligencia colectiva: visibilidad global y datos reales
¿Cómo conseguimos estos datos? La respuesta está en el poder de la inteligencia colectiva. Para que las empresas puedan actuar durante una caída, sabemos que los datos que impulsan Internet Insights deben ser fiables y seguros. En términos de fiabilidad, los datos se basan en datos de red reales. En cuanto a la seguridad, la información se deriva de un conjunto de datos masivo y colectivo. Internet Insights aprovecha la inteligencia colectiva de decenas de miles de tests de los Cloud Agents y Enterprise Agents de ThousandEyes: analiza miles de millones de mediciones diarias de rutas a miles de servicios digitales, que abarcan decenas de miles de puntos de vista ubicados en ciudades de todo el mundo.
¿Por qué es importante la inteligencia colectiva que procede de la telemetría real? Porque Internet es demasiado amplio para que una empresa individual lo controle por sí misma y los sitios web sobre caídas de servicio basados en opiniones de usuarios no verificadas pueden ser poco fiables y tergiversar la realidad de una caída. Por ejemplo, en un artículo publicado en Newsweek en agosto de 2021, Verizon señalaba los problemas que había experimentado recientemente cuando los datos de opiniones de usuarios no verificadas informaron incorrectamente de una caída a gran escala; así, señalaba que los datos de opiniones de usuarios no verificadas pueden dar lugar a "desinformación generalizada" que no es práctica para los proveedores de servicios y presenta otro desafío más que superar durante la respuesta a una caída.
Ahora, los equipos de operaciones pueden aprovechar las caídas de red y de aplicaciones detectadas en Internet Insights para llegar rápidamente al fondo de cuestiones fundamentales al inicio de una caída y de esta manera acortar enormemente el tiempo medio hasta la identificación:
- ¿Son solo ellos? ¿O hay una caída de Internet o del proveedor?
- ¿Es una caída de la aplicación, de la red o de ambas?
- ¿Cuáles son los puntos comunes que pueden indicar la causa? Por ejemplo:
- Tiempo: ¿qué está ocurriendo en un mismo espacio de tiempo?
- Proveedores de aplicaciones: ¿qué aplicaciones, una o más?
- Proveedores de red: ¿qué redes, una o más?
- Ubicaciones: ¿dónde está teniendo lugar el impacto?, ¿en el agente, las redes (rutas) o los destinos (servidores)?
- Dominios: ¿qué propiedades específicas?
En el trabajo híbrido, los nuevos desafíos requieren nuevas soluciones
No solo los equipos de operaciones se pueden beneficiar de Internet Insights. Conforme las empresas se enfrentan a nuevas situaciones de trabajo híbrido, los usuarios están más repartidos que nunca y las aplicaciones de las que dependen para seguir siendo productivos suelen estar alojadas en la nube o en la red de un proveedor de SaaS. La creciente sofisticación de este ecosistema también significa que identificar exactamente dónde está el problema es más complejo que nunca. Internet Insights proporciona un valor diferenciado a varios departamentos o equipos de la empresa:
- Para el servicio de soporte técnico de la empresa, con una responsabilidad cada vez mayor sobre los servicios que están fuera de su control, pueden reducir el tiempo medio de resolución(TMR) de las solicitudes de servicio de soporte técnico de los empleados híbridos afectados por problemas de red o de aplicaciones.
- Para los ejecutivos, significa no dar más palos de ciego, con una clara visibilidad externa de la disponibilidad de las aplicaciones desde el punto de vista de sus clientes o empleados. También obtienen información global y macroeconómica para la gestión estratégica y el reporting. Asimismo,pueden dar respuestas informadas a la desinformación sobre caídas que proceda de opiniones de usuarios no verificadas.
- Para los proveedores de servicios y los equipos de operaciones, ya no es suficiente mantener la disponibilidad general del servicio, porque los clientes esperan recibirlo estén donde estén. Pueden ver cómo se experimenta una aplicación de forma holística, aislar problemas regionales, centros de datos problemáticos, evitar respuestas SEV1 innecesarias (consulte este caso de estudio: "Cómo gana visibilidad fuera del perímetro corporativo una de las principales empresas de servicios financieros") e identificar problemas de plataforma (DNS, SSL, etc.).
- Para los departamentos de informática, pueden gestionar la respuesta a las caídas de los proveedores, reducir el denominado Mean time to Innocence (MTTI o tiempo medio hasta la inocencia, es decir, el periodo en el que se tiene que demostrar que la red no es la responsable de la incidencia y averiguar la verdadera causa) y acelerar las escaladas (consulte este caso de estudio: "Transferencias de dinero con Internet Insights"). Y, lo que es aún mejor, pueden utilizar Outage Snapshot Share Links para demostrar dicha inocencia y trabajar con la parte responsable para influir en el tiempo medio de resolución (MTTR). Al utilizar un año de datos históricos de caídas, también pueden hacer cumplir los acuerdos sobre el nivel de servicio de los proveedores, mejorar la selección de proveedores de SaaS y llevar a cabo una planificación eficaz de la red.
- Para los equipos de aplicaciones y los desarrolladores responsables de las integraciones de SaaS, pueden ver el impacto que tiene una caída en los objetivos que prueban utilizando la función Affected Tests (pruebas afectadas) de Internet Insights. Esto les permite comprender por completo cómo las dependencias externas están afectando al rendimiento de su aplicación y a la experiencia de usuario.
Las caídas del pasado destacan el valor de la visibilidad entre capas para Application Outages
Al añadir Application Outages a Network Outages, ya existente en Internet Insights, ahora podemos ofrecer la misma visualización entre capas que ya conoce de las vistas de los tests de ThousandEyes. Esto le permite comprender rápida y fácilmente si se está produciendo una caída en la red, en la aplicación o en ambas.
¿Por qué es importante la visibilidad entre capas? Veamos una caída reciente para comprender cómo puede ayudar la visibilidad que ofrece Internet Insights: Application Outages. El "verano de las caídas" de 2021 nos trajo algunas de las mayores y que más han paralizado la actividad hasta la fecha . Posteriormente, el 4 de octubre, Facebook estuvo fuera de servicio durante más de siete horas cuando un cambio de configuración dejó fuera de servicio una parte fundamental de su red troncal, lo que provocó otros problemas, incluida la caída del servicio de DNS. El 22 de julio, el DNS de Akamai estuvo fuera de servicio, lo que afectó a PlayStation Network, Delta, Costco y UPS, entre muchos otros. Previo a todo ello, el 16 de julio, Akamai tuvo otro incidente cuando su servicio de mitigación de DDoS, Prolexic Routed, provocó que los sitios web de los clientes quedaran inaccesibles.
Es posible que también recuerde la caída de Fastly el 8 de junio. Ese día, un cliente de Fastly activó un error de software latente al actualizar su propia configuración de CDN. Ese cambio, según Fastly, provocó que las aplicaciones de los clientes suministradas por Fastly no se sirvieran desde sus servidores de origen. La prensa se hizo eco de los clientes más destacados afectados, desde Amazon hasta Reddit, Spotify, eBay, Twitch y Pinterest. A continuación explicaremos cómo Internet Insights: Application Outages identificó esta caída y por qué es tan importante la visibilidad entre capas.
Al principio de la caída, vimos errores 503 de servicio no disponible en la capa de la aplicación, aunque la capa de la red parecía normal. Al hacer clic en la cronología de las caídas de las aplicaciones, vimos cómo se expandía el impacto de la caída: PayPal, Vimeo, Target: todos afectados. A partir de las agrupaciones de destinos de Internet Insights, supimos que el problema no se limitaba geográficamente a una sola aplicación o propiedad de un proveedor. Además, había un detalle fundamental: este conjunto de caídas de proveedores de aplicaciones tenía en común la red de Fastly, AS 54113. En unos minutos, Application Outages nos proporcionó una vista clara de la evolución de la caída y su causa.
Application Outages añade un valor único tanto para los proveedores de aplicaciones como para los de servicios de red. Si analizamos esta caída, es probable que Internet Insights hubiera podido proporcionar a Fastly, en tan solo unos minutos, una vista clara de la disponibilidad externa de su servicio durante la caída y los periodos de recuperación. Por otra parte, los proveedores de aplicaciones que confían en Fastly habrían sabido qué otros proveedores también experimentaron el impacto durante este mismo periodo de tiempo, para llegar a la conclusión rápidamente de que no era un problema de la aplicación. Y lo que es más importante, los proveedores habrían podido confirmar que la recuperación del servicio reflejaba la experiencia del cliente, cotejando los plazos de recuperación con datos reales de la red n de la inteligencia colectiva de ThousandEyes, añadiendo de esta manera la confianza muy necesaria durante la respuesta a la caída.
Vea este webinar bajo demanda para aprender cómo con Internet Insights puede monitorizar la experiencia digital a escala de Internet
La detección de caídas en SaaS, fundamental para la empresa
Con la disponibilidad de Application Outages, ofrecemos una nueva capa de funciones de aplicaciones en Internet Insights. Pero esto no es todo. Hoy también presentamos la incorporación de Application Outages al mapa de caídas de Internet, que permite la detección de caídas de aplicaciones casi en tiempo real. El mapa se actualiza cada 5 minutos y se puede consultar para saber rápidamente si una caída en curso en un proveedor de red o de aplicaciones es el origen de un problema que está experimentando.
En ThousandEyes, nos comprometemos a cumplir la misión de convertirnos en el "Google Maps para Internet", pero tan solo estamos rascando la superficie de las capacidades de inteligencia colectiva de la plataforma ThousandEyes. Internet Insights de ThousandEyes es una pieza fundamental del rompecabezas para resolver las grandes preguntas sobre disponibilidad, rendimiento, enrutamiento global y necesidades de planificación.
Internet Insights: Application Outages ya está disponible. De hecho, los clientes ya lo están utilizando para solucionar su falta de visibilidad más fundamental. Díganos cómo utilizaría Internet Insights y estaremos encantados de ayudarle.