Actualizaciones del producto

Atrapar a los zombis de BGP: Presentamos ThousandEyes BGP Stuck Route Observatory

Por Kemal Sanjta, Antonis Chariton & Iliana Xygkou
| | 10 minutos de lectura

Esta publicación también está disponible para: United States (English), Germany (Deutsch), Mexico (Español), France (Français), Canada (Français), Italy (Italiano), Japan (日本語), Korea (한국어), Brazil (Português) & Mainland China (简体中文).

Resumen

ThousandEyes BGP Stuck Route Observatory facilita a los operadores de red la detección de rutas bloqueadas, también conocidas como rutas zombi o fantasma (información de enrutamiento obsoleta que puede crear problemas operativos importantes), así como la localización de las redes que podrían estar causando el problema.


La pérdida de paquetes y otros problemas relacionados con la red han afectado a las redes durante décadas. A menudo, las conexiones de red fallan o se ralentizan, lo que afecta a la experiencia de los usuarios. Para resolver estos problemas, los operadores de red se enfrentan a menudo a la abrumadora tarea de resolver problemas utilizando herramientas de monitorización tradicionales que carecen de una visibilidad completa. Además, la resolución de problemas se lleva a cabo con frecuencia desde un único punto de visibilidad, normalmente el afectado, lo que limita aún más la visibilidad.

Al diagnosticar un problema, los equipos de operaciones de red (NetOps) deben tener en cuenta diversos motivos que pueden contribuir a los posibles fallos, como la aparición de agujeros negros, la caída del tráfico debido a la sobreutilización, la fibra sucia, etc. Por lo general, estos problemas están relacionados con cuestiones en el plano de datos. Sin embargo, en ocasiones surgen debido al comportamiento del plano de control. Más específicamente, las decisiones de enrutamiento, o la falta de ellas, pueden contribuir significativamente a la creación de agujeros negros.

Hoy presentamos una nueva herramienta para los operadores de red: el observatorio de rutas bloqueadas de BGP, que ayuda a identificar uno de los motivos más comunes de la aparición de agujeros negros: los zombis de BGP. Los zombis de BGP o rutas bloqueadas son rutas que persisten en los routers a pesar de que el sistema autónomo (AS) de origen las retira.

Al igual que nuestro popular Mapa de caídas de Internet, el observatorio de rutas bloqueadas de BGP es gratuito y está disponible para todos.

¿Rutas bloqueadas? ¿Zombis de BGP?

En el protocolo BGP (Border Gateway Protocol), un AS, una red bajo un control administrativo único, anuncia un prefijo (un bloque de direcciones IP) que posee a sus AS vecinos. Estos AS propagan posteriormente el anuncio a sus vecinos, continuando este proceso de forma iterativa hasta que el prefijo es accesible desde todos los AS de Internet. Una vez que el AS de origen ya no desea que se pueda acceder al prefijo a través de esta ruta específica o debido a motivos como la caída de los pares, la congestión o el mantenimiento, retira el prefijo de sus vecinos. De forma similar al anuncio, la retirada se propaga a todos los AS y el prefijo se elimina de la tabla de enrutamiento global.

Los zombis de BGP (rutas bloqueadas) se producen durante el proceso de retirada, cuando un router de un AS no consigue propagar el mensaje de retirada. Sus AS vecinos no reciben una notificación y seguirán considerando que la ruta es válida. Todos los vecinos posteriores harán lo mismo. Estas rutas bloqueadas indican erróneamente que un prefijo todavía es accesible aunque la ruta no exista para la ruta asociada.

¿Por qué se producen las rutas de BGP bloqueadas? ¿Cuál es el impacto?

Las rutas de BGP bloqueadas pueden ocurrir debido a errores de software, problemas de hardware y configuración o errores en el protocolo de BGP que impiden que los enrutadores retiren o actualicen correctamente las rutas en sus tablas de enrutamiento de BGP.

Las rutas de BGP bloqueadas pueden dar lugar a decisiones de enrutamiento no óptimas, inestabilidad de la red, bucles de enrutamiento e interrupciones en el flujo del tráfico. Estos problemas provocan problemas operativos, como un deterioro del rendimiento y caídas.

¿Por qué las rutas de BGP bloqueadas son tan difíciles de detectar?

La detección automatizada de zombis de BGP en redes operativas es intrínsecamente difícil debido a la falta de datos fiables. Sin conocer las intenciones de cada operador de red, es todo un reto deducir con confianza por qué se envió un mensaje de retirada a un sistema autónomo. Más allá de eso, la detección de rutas bloqueadas requiere visibilidad desde múltiples puntos de visibilidad, desplegados estratégicamente en todo el mundo, que abarquen los niveles 1, 2 y otras redes, como los intercambios de Internet.

¿Cómo funciona el observatorio de rutas bloqueadas de BGP?

Para hacer frente a estos desafíos, ThousandEyes BGP Stuck Route Observatory utiliza prefijos de baliza para detectar las rutas bloqueadas. Los prefijos de baliza son prefijos que se anuncian periódicamente y se retiran en momentos específicos. Saber exactamente cuándo se debe eliminar un prefijo de la tabla de enrutamiento de forma global aumenta la confianza en la identificación de una ruta como bloqueada.

El observatorio utiliza una nueva metodología de balizas que incorpora mejoras significativas en los anuncios de balizas, lo que nos permite rastrear cuánto se tarda en retirar un prefijo, si el número de rutas bloqueadas sube o baja y el tiempo que tardan los operadores en identificarla. (Para obtener más información sobre esta metodología, consulte la serie de blogs sobre zombis de BGP).

Este enfoque permite al observatorio de rutas bloqueadas de BGP proporcionar una forma simplificada de determinar si su AS se ve potencialmente afectado por ciertos AS en la ruta (como un proveedor ascendente) o si su AS puede tener un error (en otras palabras, si el problema puede estar en su red). Mediante el procesamiento de los datos incorporados de cientos de monitores de BGP desplegados estratégicamente en todo el mundo, el observatorio de rutas bloqueadas de BGP detecta las rutas bloqueadas en función de nuestros anuncios de prefijos de baliza.

Cuando introduzca un número de sistema autónomo (ASN) en el campo de búsqueda del observatorio de rutas bloqueadas de BGP, obtendrá resultados que indican si el ASN no está afectado, si está potencialmente afectado (por otro ASN) o puede ser el origen del problema (es decir, está contribuyendo al problema). Los resultados también mostrarán las diferentes rutas de AS en las que hemos observado el posible problema.

Figura 1. En estos resultados de ejemplo, el observatorio de rutas bloqueadas de BGP ha atribuido una posible infección de ruta zombie a Zayo, un gran proveedor de nivel 1 (ASN 6461)
Figura 1. En estos resultados de ejemplo, el observatorio de rutas bloqueadas de BGP ha atribuido una posible infección de ruta zombie a Zayo, un gran proveedor de nivel 1 (ASN 6461)

Si se indica que su ASN puede verse afectado o que posiblemente tenga un error, puede ponerse en contacto con el equipo de ThousandEyes para obtener más insights sobre el alcance del problema detectado por el observatorio de rutas bloqueadas de BGP, así como orientación para identificar dónde se producen los problemas.

¿Por qué es importante detectar las rutas BGP bloqueadas?

Las rutas zombi o bloqueadas siguen siendo frecuentes en Internet, a pesar de las mejoras en el protocolo BGP (RFC 9687) y en el hardware. Como se ha mencionado, estas rutas de BGP bloqueadas pueden reducir el rendimiento o provocar interrupciones de suministro, lo que en última instancia conduce a experiencias digitales deficientes para sus usuarios. Para protegerse de estos impactos, la detección sistemática y el análisis del origen del problema son vitales, ya que le ayudan a eliminar más rápidamente las rutas bloqueadas y a identificar o descubrir los fallos que lo causan.

Además, monitorizar su participación en la aparición de rutas bloqueadas y actuar en consecuencia es una parte importante de ser un miembro responsable de la comunidad global de Internet. Internet es un gráfico conectado; un fallo de un AS puede causar problemas en las operaciones de cualquier otro AS en Internet.

Al diagnosticar cualquier problema de red, identificar cuál es el problema es solo una pieza del puzle. También tiene que determinar rápidamente dónde se está produciendo el problema. Con ThousandEyes BGP Stuck Route Observatory, los equipos de NetOps cuentan con una potente herramienta que les ayuda a responder los quizás y proporciona insights sobre los posibles dónde.


Vaya más allá de la monitorización tradicional y dote a su equipo de NetOps de las herramientas necesarias para garantizar las experiencias digitales de forma proactiva. Comience hoy mismo su prueba gratuita.


Upgrade your browser to view our website properly.

Please download the latest version of Chrome, Firefox or Microsoft Edge.

More detail