Nous avons déjà vécu ce scénario. Internet, les logiciels SaaS, le cloud, les équipements mobiles : chaque vague de transformation digitale apporte son lot de complexité, de nouvelles dépendances et de nouveaux défis pour assurer la qualité des expériences utilisateur. Et à chaque fois, nous nous sommes adaptés, apprenant à gérer ce que nous ne pouvions pas entièrement contrôler, à observer et comprendre ce qui ne nous appartenait pas, et à optimiser des résultats que nous ne pouvions pas toujours anticiper.
Aujourd'hui, nous assistons à une nouvelle transformation majeure, portée par l'IA agentique : des entités digitales autonomes capables d'opérer, de prendre des décisions et d'exécuter des transactions de manière indépendante. Il ne s'agit pas simplement de nouveaux workloads, mais d'un changement fondamental dans la manière dont les systèmes digitaux fonctionnent, interagissent et créent de la valeur.
Chez Cisco ThousandEyes, notre mission a toujours été de garantir des expériences digitales exceptionnelles pour chaque utilisateur, en assurant la résilience digitale sur l'ensemble des domaines d'une expérience connectée, qu'ils soient sous contrôle direct ou non de l'entreprise. À l'heure où les interactions à la vitesse des machines redéfinissent la connectivité, assurer les performances de bout en bout n'est plus seulement une bonne pratique. C'est un impératif.
Redéfinir la notion de qualité de l'expérience à l'ère des systèmes d'IA agentique
J'utilise ChatGPT presque tous les jours et j'ai pris l'habitude d'attendre ses réponses. Mon attente ne porte pas sur la rapidité, mais sur la qualité et la fiabilité de la réponse. Ce changement est fondamental.
Avant, la performance réseau se mesurait en termes de vitesse et de disponibilité, dans des contextes d'usage prévisibles et pilotés par des humains. Mais puisque les agents d'IA agissent de plus en plus comme des utilisateurs à part entière, prenant des décisions à la vitesse des machines, il devient nécessaire de redéfinir ce qui constitue une expérience de qualité. Il n'est plus uniquement question de vitesse, mais aussi de fiabilité, de précision et de confiance.
Contrairement aux êtres humains, les agents d'IA déclenchent des rafales rapides d'appels d'API, agrègent des données provenant de multiples sources et exécutent des processus complexes en quelques millisecondes. Imaginez un agent d'IA chargé de réserver un voyage : il peut interroger simultanément des API de vols, des bases de données hôtelières, des services météorologiques et des systèmes de paiement, chaque dépendance étant critique pour la transaction.
Lorsqu'un agent rencontre un problème, celui-ci peut se propager en cascade à d'autres agents, entraînant des réponses inadaptées ou des attentes non satisfaites. Un retard de quelques millisecondes ou des données altérées peuvent suffire à bloquer une activité lorsque les agents d'IA sont aux commandes.
Les agents d'IA se déploient, évoluent et interagissent en temps réel, créant un réseau vivant de dépendances dynamiques qui met à l'épreuve les approches classiques de gestion du réseau. Cela soulève une question essentielle : quelles sont les attentes en matière de niveau de service (SLE) pour des systèmes agent à agent ? Si les indicateurs classiques des contrats par niveau de service (SLA), comme la disponibilité et la latence, restent importants, les SLE introduisent une nouvelle dimension : mesurer si les workflows s'exécutent correctement, si les données sont valides et si toutes les dépendances répondent comme prévu. En d'autres termes, l'agent a-t-il atteint l'objectif attendu ?
Même des perturbations mineures peuvent se propager à travers les processus automatisés et avoir un impact significatif sur l'activité. Pour garantir que la qualité de service reflète l'importance des workflows basés sur des agents, chaque maillon de la chaîne de services doit être observable et maîtrisable, y compris lorsque ces chaînes évoluent dynamiquement en fonction de la logique des agents et de facteurs externes. La réussite sera de plus en plus mesurée par la fiabilité des workflows selon les objectifs métier, et non plus uniquement sur le débit ou la latence.
Gérer des dépendances imbriquées
Les systèmes classiques fonctionnent selon des relations prévisibles : le service A appelle le service B selon une séquence connue. Les agents d'IA, en revanche, créent des relations dynamiques et dépendantes du contexte, qui varient d'une tâche à une autre, générant des dépendances d'infrastructure non déterministes et des modes de défaillance difficiles à anticiper.
Le défi est le suivant : vous ne dépendez pas uniquement d'un fournisseur, mais également des fournisseurs de ce fournisseur. Et ces dépendances évoluent en permanence, à mesure que les acteurs du marché ajustent leur infrastructure pour suivre le rythme de l'innovation. Une modification plusieurs niveaux en amont peut se répercuter et affecter l'expérience digitale.
L'importance d'un contexte exhaustif
Offrir des expériences de qualité dans un environnement agentique exige de comprendre le contexte, non seulement de bout en bout à travers la chaîne de services, mais aussi de haut en bas sur l'ensemble des couches de la pile technologique.
Cette problématique rappelle les défis déjà rencontrés avec les applications distribuées. Avec la multiplication des agents agissant en notre nom, il est inévitable qu'ils soient intégrés aux cadres Zero Trust. Mais le défi opérationnel est réel : tandis que les équipes NetOps, SecOps et DevOps interviennent sur des systèmes complexes, qu'il s'agisse de déployer de nouveaux agents, des politiques de sécurité ou des mises à jour, la qualité de l'expérience digitale finale reste une responsabilité de bout en bout.
Si vous constatez une dégradation des performances, il est indispensable de déterminer si elle résulte du déploiement d'un nouvel agent sans politiques de sécurité adaptées, d'un changement de politique bloquant une action attendue, de la défaillance d'une dépendance en amont ou d'une dégradation des conditions réseau. Et pour ce faire, vous avez besoin de contexte.
L'assurance de bout en bout à l'ère de l'IA toujours active
Depuis longtemps, nos clients utilisent Cisco ThousandEyes pour superviser des transactions de bout en bout et garantir la connectivité ainsi que des expériences digitales de qualité. Aujourd'hui, il est nécessaire d'élargir notre conception même de la notion de transaction. Il ne s'agit plus uniquement d'interactions entre humains et machines. Il faut désormais prendre en compte des agents qui communiquent entre eux sur des réseaux que nous ne contrôlons pas, ainsi que des agents qui s'appuient sur des serveurs MCP (Model Context Protocol) externes pour accéder aux outils et aux informations contextuelles.
Imaginez le traçage des services distribués, appliqué aux systèmes multi-agents. Il ne s'agit plus seulement de suivre le parcours d'un utilisateur dans une application, mais de comprendre les interactions entre agents, y compris le comportement réseau, le timing des appels aux outils et les indicateurs d'infrastructure.
C'est là que l'approche intégrée de Cisco offre une valeur ajoutée déterminante. Des innovations récentes, comme l'intégration du traçage distribué entre Cisco ThousandEyes et Splunk, illustrent la manière dont nous assurons les expériences utilisateur de bout en bout. À mesure que les systèmes pilotés par des agents se généralisent, ces capacités devront s'étendre à la compréhension des communications entre agents et des dépendances tierces.
Cisco est idéalement positionné pour relever ce défi, non pas à travers des solutions ponctuelles cloisonnées, mais grâce à une résilience digitale intégrée permettant de s'adapter à la maturité des architectures agentiques.
Cisco ThousandEyes s'engage à accompagner ses clients dans cette nouvelle ère, car la résilience digitale repose désormais sur une assurance des performances de bout en bout dans un monde où le réseau ne dort jamais, où les agents ne s'arrêtent jamais et où chaque interaction compte.