私たちはこの状況を以前も経験しました。インターネット、SaaS、クラウド、モビリティ。デジタル トランスフォーメーションのこのような波が発生するたびに、優れたユーザー体験を提供して確保する際の新たな複雑さ、依存関係、課題が生まれます。私たちはそのたびに適応し、完全に制御できないものを管理する方法、所有していないものを見て理解する方法、常に予測できるとは限らない結果を最適化する方法を学んできました。
そして今、エージェント型 AI によって推進される別の大きな変化が生まれています。運用、意思決定、トランザクションの実行を別々に行う、自律型デジタルエンティティです。これは単なる新しいワークロードではありません。デジタルシステムの運用、やり取り、価値提供の方法の根本的な変化です。
Cisco ThousandEyes は常に、自社所有か否かを問わず、コネクテッド エクスペリエンスのあらゆる領域で Digital Resilience を提供し、すべてのユーザーにきわめて優れたデジタル体験を提供することを使命としてきました。マシンスピードのインタラクションが接続を再定義する中、エンドツーエンドのアシュアランスは単なるベストプラクティスではありません。ビジネス上の必須目標なのです。
AI エージェントシステムの時代に優れたエクスペリエンスを再定義
私はほぼ毎日 ChatGPT を使っていますが、回答を待つことに慣れてきました。期待していることはスピードではなく、回答の品質と信頼性です。この変化は重要です。
これまで、ネットワークパフォーマンスは、予測可能な人間主導の使用パターンを対象に、速度と可用性によって測定されてきました。しかし、AI エージェントが主要なユーザーになり、マシンの速度で意思決定を行うようになったことで、私たちは優れたエクスペリエンスとは何かを再定義する必要があります。問題は「どの程度速いか」だけではなく、「どの程度確実性があり、どの程度正確で、どの程度信頼できるか」です。
人間が生成するトラフィックとは異なり、AI エージェントは API コールの迅速なバーストを開始し、複数のソースのデータを集約して、複雑なプロセスを数ミリ秒で実行します。1 つの AI エージェントが旅行を予約する状況を想像してみてください。フライト API、ホテルのデータベース、気象サービス、決済処理者に同時にクエリを実行する可能性があり、それぞれの依存関係がトランザクションにとって重要です。
1 つのエージェントで問題が発生すると、他のエージェントに連鎖的に影響し、回答の品質が低下したり、期待する結果にならなかったりする可能性があります。AI エージェントが主導権を握っている場合、ミリ秒の遅延やデータの破損が原因で業務が中断されるおそれがあります。
いくつもの AI エージェントが起動し、スケールアウトし、リアルタイムでやり取りを行うことで、従来のネットワーク管理では対処が難しい複雑なダイナミックな依存関係が生じます。これにより、重要な疑問が生まれます。エージェント間システムに対するサービスレベル期待値(SLE)はどの程度ですか? 可用性や遅延などの従来のサービスレベル契約( SLA )の指標は引き続き重要ですが、SLE により、新しい観点が追加されます。具体的には、ワークフローが正常に完了したかどうか、データが有効かどうか、すべての依存関係が正しく対応しているどうかを測定します。つまり、エージェントが、意図したビジネス成果を達成したかどうかということです。
わずかな中断でも、自動化されたプロセスによって連鎖的に広がり、ビジネスに重大な影響をもたらす可能性があります。サービス品質とエージェント主導型ワークフローの重要性を一致させるには、サービスチェーン内のすべてのリンクを観測可能かつ管理可能にする必要があります。エージェントのロジックや外部要因に応じてこれらのチェーンがダイナミックに変化する場合であってもです。成功は次第に、単なる生のスループットや遅延ではなく、ビジネスの意図に沿ったワークフローが確実に完了するかどうかで測定されるようになるでしょう。
幾重もの依存関係への対処
従来のシステムは、サービス A がサービス B を既知のシーケンスで呼び出すというような、予測可能な関係で動作します。しかし、AI エージェントは、タスクごとに変化する、コンテキストに依存したダイナミックな関係を作成します。その結果、インフラストラクチャへの依存関係は非決定論的になり、障害モードが予測できなくなります。
ここで課題となるのは、あるプロバイダーへの依存関係を持つだけでなく、そのプロバイダーのプロバイダーの依存関係の影響も受けるということです。そして、プロバイダーは市場の進化に合わせてインフラストラクチャを調整するため、これらの依存関係は常に変化しています。いくつか下のレイヤーでの変化が、デジタル体験に波及し、影響を与える可能性があります。
コンテキストという最も重要な要素:上から下へ、エンドツーエンドで
エージェントが広く使用されている世界で優れたエクスペリエンスを提供するには、コンテキストを理解する必要があります。サービスチェーン全体のエンドツーエンドだけでなく、スタックのすべてのレイヤーを徹底的に理解しなければなりません。
これは、分散型アプリケーションで以前発生していた課題を反映しています。人間の代わりに稼働するエージェントが急増しているため、これらのエージェントをゼロトラストフレームワークに組み込むことは不可欠です。しかし、ここに運用上の課題があります。NetOps、セキュリティ運用、DevOps の各チームが、複雑なシステムで作業して、エージェントの起動、セキュリティポリシーの適用、更新のプッシュなどを行っていますが、デジタル体験の最終的な提供はエンドツーエンドの責任のままなのです。
パフォーマンスの低下が確認された場合は、その原因を把握する必要があります。誰かが適切なセキュリティポリシーなしで新しいエージェントを作成した、セキュリティポリシーが変更されて想定されるアクションがブロックされた、ダウンストリームの依存関係が失敗した、ネットワークの状態が低下したなど、さまざまな原因が考えられます。状況の確認が必要です。
常時稼働の AI 時代におけるエンドツーエンドのアシュアランス
シスコのお客様は長い間、Cisco ThousandEyes を使用してエンドツーエンドのトランザクションを監視し、接続と優れたデジタル体験が得られるようにしてきました。今、私たちはトランザクションに対する考え方を拡大する必要があります。もはや、人間が機械に話すだけではありません。私たちが制御していないネットワークにまたがって他のエージェントと通信するエージェントや、ツールとコンテキストを外部のモデル コンテキスト プロトコル(MCP)サーバーに依存しているエージェントを考慮する必要があります。
複数のエージェントからなるシステムの分散トレースについて考えてみましょう。アプリケーションにおけるユーザーのプロセスを追跡するだけでなく、エージェント間の相互作用(ネットワークの動作、ツールを呼び出すタイミング、インフラストラクチャ メトリックなど)を把握します。
ここで、シスコの統合アプローチが大きな価値をもたらします。Cisco ThousandEyes と Splunk の分散トレースの統合のような最近のイノベーションは、エンドツーエンドでユーザー体験を保証する方法を実証しています。 エージェント主導型システムが普及するにつれて、この機能は、エージェント間コールやサードパーティの依存関係の理解にまで拡張されなければなりません。
シスコはこれを提供する独自の立場を確立しており、重複するポイントソリューションとしてではなく、エージェントのアーキテクチャが成熟するにつれて適応する統合 Digital Resilience として提供しています。
Cisco ThousandEyes は、この新たな時代におけるお客様の成功を後押しすることに力を注いでいます。Digital Resilience とは今、決してネットワークが休止せず、エージェントが停止せず、あらゆるやり取りが重要である世界におけるエンドツーエンドのアシュアランスを意味するからです。