제품 업데이트

BGP 좀비 찾아내기: ThousandEyes BGP Stuck Route Observatory 발표

기준 Kemal Sanjta, Antonis Chariton & Iliana Xygkou
| | 7 분 읽기

이 게시물은 다음 언어로도 제공됩니다. United States (English), Germany (Deutsch), Mexico (Español), Spain (Español), France (Français), Canada (Français), Italy (Italiano), Japan (日本語), Brazil (Português) & Mainland China (简体中文).

요약

ThousandEyes BGP Stuck Route Observatory를 사용하면 네트워크 운영자는 좀비 또는 고스트 경로(오래된 라우팅 정보를 갖고 있어 중대한 운영 문제를 초래할 가능성이 있는 경로)라고 하는 고착 경로를 쉽게 탐지하고, 문제의 원인일 가능성이 있는 네트워크를 정확하게 찾아낼 수 있습니다.


패킷 손실 및 기타 네트워킹 관련 문제는 수십 년간 네트워크를 괴롭혀 온 문제입니다. 네트워크 연결이 실패하거나 속도가 저하되면 사용자 경험에 영향을 미치는 경우가 많습니다. 이러한 문제를 해결하기 위해 네트워크 운영자는 포괄적인 가시성이 부족한 기존의 모니터링 툴을 사용하여 엄두가 나지 않는 문제 해결 작업을 해야 하는 상황을 자주 겪게 됩니다. 게다가 주로 문제의 영향을 받은 밴티지 포인트 한 곳에서 문제 해결을 수행하는 경우가 많으므로, 가시성이 더욱 제한됩니다. 

문제를 진단할 때 네트워크 운영(NetOps) 팀은 잠재적인 실패의 원인이 될 수 있는 여러 가지 이유(예: 블랙홀 라우팅, 과도한 사용으로 인한 트래픽 손실, 오염된 광섬유 등)를 고려해야 합니다. 일반적으로 이러한 문제는 데이터 플레인의 문제와 관련이 있습니다. 그러나 제어 플레인 동작으로 인해 발생하는 경우도 간혹 있습니다. 더 구체적으로 설명하자면 라우팅 결정이 블랙홀 라우팅의 중대한 원인이 될 수 있으며, 라우팅 결정이 아예 부재한 경우에도 그럴 가능성이 있습니다.

오늘 ThousandEyes에서는 네트워크 운영자를 위한 새로운 툴인 BGP Stuck Route Observatory를 발표했습니다. 이 툴은 블랙홀 라우팅, 즉 BGP 좀비라고 하는 현상의 일반적인 원인을 식별할 수 있도록 지원합니다. BGP 좀비 또는 고착 경로는 원본 AS(자율 시스템)에서 해당 경로를 철회했음에도 불구하고 계속 남아 있는 경로입니다.

ThousandEyes의 주요 인터넷 중단 지도와 마찬가지로, BGP Stuck Route Observatory도 모든 사용자에게 무료로 제공됩니다.

고착 경로 또는 BGP 좀비란?

BGP(Border Gateway Protocol)에서, 단일한 관리 제어에 속한 네트워크인 AS는 자신이 소유한 접두사(IP 주소로 구성된 블록)를 인접한 AS에게 발표합니다. 이러한 AS는 이후에 이러한 발표 내용을 인접한 라우터(neighbor router)에 전파하는데, 인터넷 전체의 모든 AS에서 해당 접두사에 연결할 수 있게 될 때까지 이 프로세스를 계속 진행합니다. 원본 AS가 이러한 특정 경로를 통해 해당 접두사에 연결하는 걸 더 이상 원치 않거나 피어링 저하, 혼잡, 유지 관리 등과 같은 이유가 있을 경우 원본 AS는 인접한 라우터에서 해당 접두사를 철회합니다. 발표와 마찬가지로, 철회도 모든 AS에 전파되며 해당 접두사는 전역 라우팅 테이블에서 제거됩니다.

BGP 좀비(고착 경로)는 철회 프로세스가 진행될 때 일어나는 현상으로, AS 내의 라우터가 철회 메시지를 전파하는 데 실패할 때 발생합니다. 인접한 라우터 AS에 알림이 전달되지 않으며 해당 경로는 계속 유효한 것으로 간주됩니다. 이후의 모든 인접한 라우터도 동일한 작업을 수행하게 됩니다. 이러한 고착 경로는 연결된 경로에 대한 경로가 더 이상 존재하지 않는데도 접두사가 계속 연결 가능한 것으로 잘못 표시합니다.

고착 BGP 경로가 발생하는 이유 및 그로 인한 영향

고착 BGP 경로는 소프트웨어 버그, 하드웨어 및 설정 문제 또는 라우터가 BGP 라우팅 테이블 내의 경로를 올바르게 철회하거나 업데이트하지 못하게 하는 BGP 프로토콜 결함으로 인해 발생할 수 있습니다.

고착 BGP 경로는 최적화되지 않은 라우팅 결정, 네트워크 불안정성, 라우팅 루프, 트래픽 플로우 중단으로 이어질 수 있습니다. 이러한 문제는 성능 저하 및 중단을 비롯한 운영 문제를 유발합니다.

고착 BGP 경로를 찾아내기 어려운 이유

운영 네트워크 내의 BGP 좀비를 자동으로 탐지하는 건 실측 데이터가 부족하기 때문에 본질적으로 어려운 일입니다. 각 네트워크 운영자의 의도를 알 수 없는 상태에서는 철회 메시지가 자율 시스템에 전송된 이유를 확실하게 추론하기가 어렵습니다. 게다가 고착 경로를 탐지하려면 전 세계에 전략적으로 구축되어 있고 Tier 1, Tier 2에 분포된 여러 밴티지 포인트 및 기타 네트워크(예: 인터넷 교환)에서 가시성을 확보해야 합니다.

BGP Stuck Route Observatory의 기능

이러한 당면 과제를 해결하기 위해 ThousandEyes BGP Stuck Route Observatory에서는 비컨 접두사를 사용하여 고착 경로를 탐지합니다. 비컨 접두사는 특정 시점에 주기적으로 발표되고 철회되는 접두사입니다. 접두사가 라우팅 테이블에서 언제 제거되는지 정확히 알면 전역에서 확실하게 고착된 경로를 식별할 수 있습니다.

Observatory에서는 대폭 개선된 비컨 광고 기능이 포함된 새로운 비컨 방법론을 사용합니다. 따라서 접두사를 철회하는 데 걸리는 시간, 고착 경로의 증가 또는 감소 여부, 운영자가 고착 경로를 식별하는 데 걸리는 시간을 추적할 수 있는 기능을 제공합니다. (이 방법론에 대해 더 자세히 알아보려면 BGP 좀비 블로그 시리즈를 참조하세요.)

이러한 접근 방식을 통해 BGP Stuck Route Observatory는 작업자의 AS가 경로에 있는 특정 AS(예: 업스트림 사업자)의 영향을 받았는지 또는 작업자의 AS에 오류가 있을 가능성(즉, 문제가 작업자의 네트워크에서 발생했을 가능성)이 있는지 확인할 수 있는 간소화된 방법을 제공합니다. BGP Stuck Route Observatory는 전 세계에 전략적으로 구축된 수백 개의 BGP 모니터에서 수집한 데이터를 처리하여 ThousandEyes의 비컨 접두사 광고를 토대로 고착 경로를 탐지합니다.

BGP Stuck Route Observatory의 룩업 필드에 ASN(자율 시스템 번호)을 입력하면 해당 ASN이 영향을 받지 않았는지, 다른 ASN에 의해 영향을 받을 가능성이 있는지, 문제의 원인일 가능성이 있는지를 나타내는 결과가 표시됩니다. 이러한 결과에는 잠재적인 문제가 관측된 다른 AS 경로도 표시됩니다.

그림 1. 이 예시 결과에서 BGP Stuck Route Observatory는 잠재적인 좀비 경로 감염의 원인을 대형 Tier 1 사업자인 Zayo(ASN 6461)로 판단함
그림 1. 이 예시 결과에서 BGP Stuck Route Observatory는 잠재적인 좀비 경로 감염의 원인을 대형 Tier 1 사업자인 Zayo(ASN 6461)로 판단함

ASN이 잠재적으로 영향을 받았거나 오류가 발생했을 가능성이 있는 경우 ThousandEyes 팀에 연락하면 BGP Stuck Route Observatory에서 탐지한 문제의 범위에 대해 추가적인 인사이트를 얻을 수 있고, 문제가 발생한 위치를 식별하는 데 필요한 안내도 받을 수 있습니다.

고착 BGP 경로를 찾아내는 게 중요한 이유

BGP 프로토콜(RFC 9687) 및 하드웨어의 개선에도 불구하고 좀비 또는 고착 경로는 인터넷상에서 여전히 만연한 문제입니다. 앞서 언급했듯이, 이러한 고착 BGP 경로는 성능 저하 또는 중단을 유발할 수 있으며 궁극적으로는 사용자의 디지털 경험을 악화시킬 수 있습니다. 이러한 영향을 방지하려면 고착 경로를 더 빠르게 제거하고, 이러한 경로를 유발하는 결함을 정확하게 찾아내거나 발견하는 데 도움이 되는 체계적인 탐지 및 침입 경로 분석이 필수적입니다.

또한 고착 경로 발생 시 작업자 본인의 참여를 모니터링하고 이에 대한 조치를 취하는 것은 글로벌 인터넷 커뮤니티의 책임감 있는 일원으로서 중요한 역할입니다. 인터넷은 연결된 그래프입니다. 한 AS의 결함은 인터넷상에 있는 다른 AS의 운영에 문제를 일으킬 수 있습니다.

네트워크 문제를 진단할 경우, 문제가 발생 중인지 식별하는 건 퍼즐의 한 조각에 불과합니다. 문제가 어디에서 일어난 건지도 신속하게 확인해야 합니다. ThousandEyes BGP Stuck Route Observatory를 활용하면 NetOps 팀은 문제 발생 '가능성'에 대한 답을 찾을 수 있도록 지원하고, 문제 발생 '위치'에 대한 인사이트를 제공하는 강력한 툴을 보유하게 됩니다.


기존의 모니터링 방식에서 벗어나 NetOps 팀이 디지털 경험을 사전 예방적으로 보장할 수 있는 역량을 갖추도록 지원하세요. 지금 ThousandEyes 무료 평가판을 시작해 보세요.


Upgrade your browser to view our website properly.

Please download the latest version of Chrome, Firefox or Microsoft Edge.

More detail