le 16-04-2025 02:42 AM
Je te transmets à nouveau le message que j'avais préparé pour Cisco suite à notre conversation. Je ne sais pas pourquoi, il n'est pas parti de ma boîte la première fois :
REP Instability & Spanning-Tree Compatibility Issue in Cisco Network
Dear Cisco Technical Team,
We are experiencing significant instability in our network, which consists of two Cisco 9500 core switches and multiple Cisco Catalyst 3560 nodes configured in a REP (Resilient Ethernet Protocol) + HSRP (Hot Standby Router Protocol) architecture. Our infrastructure is built on two ring topologies, and we are facing recurring issues that cause service interruptions and performance degradation.
We have observed the following log entries on both the 3560 node switches and 9500 core switches:
Log from a 3560 Switch
Jun 13 10:12:39: %SYS-4-CHUNKSIBLINGSEXCEED: Number of siblings in a chunk has gone above the threshold. Threshold:10000 Sibling-Count:22945 Chunk:0xB76FB8C Name:REP notify Mult -Process= "Chunk Manager", ipl= 0, pid= 1-Traceback= 903600z 3519260z 3519500z 43C367Cz 43BF36Cz
Logs from the 9500 Switches
*Jun 13 08:42:53: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is non-operational due to neighbor not responding*Jun 13 08:42:53: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is operational*Jun 13 08:42:55: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is non-operational due to neighbor not responding*Jun 13 08:42:56: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is operational...*Jun 13 09:02:05: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/2 (segment 2) is non-operational due to neighbor not responding*Jun 13 09:02:06: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/2 (segment 2) is operational
These logs indicate frequent instability on segments 1 and 2, where links alternate between operational and non-operational states due to neighbor communication issues.
To facilitate troubleshooting, here are the details of our core switches and node switches:
Cisco Catalyst 3560
Cisco Catalyst 9500
Attachments:
Conclusion
We have identified a potential protocol conflict between REP and Spanning-Tree, leading to network instability. While other issues (MTU mismatch, VRF, VLAN adjustments) have been resolved, we now need Cisco’s expert input to determine the best way forward.
We appreciate your guidance and recommendations to help us stabilize the network.
Best regards,
Je te transmets à nouveau le message que j'avais préparé pour la suite Cisco à notre conversation. Je ne sais pas pourquoi, il n'est pas parti de ma boîte la première fois :
Problème d'instabilité REP et de compatibilité Spanning-Tree dans le réseau Cisco
Chère équipe technique Cisco,
Nous rencontrons une instabilité importante dans notre réseau, qui se compose de deux commutateurs centraux Cisco 9500 et de plusieurs nœuds Cisco Catalyst 3560 configurés dans une architecture REP (Resilient Ethernet Protocol) + HSRP (Hot Standby Router Protocol). Notre infrastructure est construite sur deux topologies en anneau, et nous sommes confrontés à des problèmes récurrents qui provoquent des interruptions de service et une dégradation des performances.
________________________________________
1. Résumé du problème
Nous avons observé les entrées de journal suivantes sur les commutateurs de nœuds 3560 et les commutateurs centraux 9500 :
Journal d'un commutateur 3560
13 juin 10:12:39 : %SYS-4-CHUNKSIBLINGSEXCEED : Le nombre de frères dans un bloc a dépassé le seuil. Seuil : 10 000 Nombre de frères : 22 945 Bloc : 0xB76FB8C Nom : REP notify Mult -Process= « Chunk Manager », ipl= 0, pid= 1
-Traceback= 903 600z 3519 260z 3519 500z 43C367Cz 43BF36Cz
Journaux des commutateurs 9500
*13 juin 08:42:53 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est non opérationnel car le voisin ne répond pas
*13 juin 08:42:53 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est opérationnel
*13 juin 08:42:55 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est hors service en raison d'une absence de réponse du voisin
*13 juin 08:42:56 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est opérationnel
...
*13 juin 09:02:05 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/2 (segment 2) est hors service en raison d'une absence de réponse du voisin
*13 juin 09:02:06 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/2 (segment 2) est opérationnel
Ces journaux indiquent une instabilité fréquente sur les segments 1 et 2, où les liaisons alternent entre des états opérationnels et non opérationnels en raison de problèmes de communication avec les voisins. ________________________________________
2. Enquête et principaux résultats
• Coexistence de Spanning Tree (Rapid-PVST) et de REP :
Lors du dépannage, nous avons constaté que Rapid-PVST est activé par défaut sur tous les commutateurs. Nous soupçonnons que l'activation simultanée de REP et de Spanning Tree peut être à l'origine de conflits de protocoles.
Cependant, nos informations avant-vente indiquaient que REP est interopérable avec STP. Pourriez-vous confirmer si cette coexistence pose problème ? Dans le cas contraire, quelle est la meilleure pratique pour garantir le bon fonctionnement des deux protocoles ?
________________________________________
3. Prochaines étapes
• En attente de la confirmation de Cisco concernant REP et Spanning Tree :
Nous avons besoin des conseils de Cisco sur l'approche recommandée pour gérer la coexistence de REP et de STP.
Si nécessaire, nous planifierons une période de maintenance pour désactiver Spanning Tree sur les boucles REP dans les services généraux. Cependant, ce changement pourrait avoir un impact global sur le réseau LUMEN.
• Coordination supplémentaire :
Nous ajusterons notre plan d’action en fonction des recommandations de Cisco afin de garantir la stabilité du réseau sans interruption de service imprévue.
________________________________________
4. Détails de l’équipement
Pour faciliter le dépannage, voici les détails de nos commutateurs principaux et de nos commutateurs de nœuds :
Cisco Catalyst 3560
• Numéro de modèle : WS-C3560CX-12PD-S
• Numéro de série : FOC2535Y06Q
Cisco Catalyst 9500
• Numéro de modèle : C9500-24Y4C
• Numéro de série : FDO25461GSF
Pièces jointes :
• Diagramme de topologie du réseau
• Afficher les résultats d’exécution pour :
o Un nœud 3560
o Deux commutateurs principaux 9500
________________________________________
Conclusion
Nous avons identifié un conflit de protocole potentiel entre REP et Spanning Tree, entraînant une instabilité du réseau. Bien que d'autres problèmes (inadéquation MTU, VRF, ajustements VLAN) aient été résolus, nous avons désormais besoin de l'avis des experts de Cisco pour déterminer la meilleure solution.
Nous vous remercions de vos conseils et recommandations pour nous aider à stabiliser le réseau.
Cordialement,
le 16-04-2025 05:10 AM
Bonjour @sylv-guiton
Les ports configurés pour REP sont retirés du contrôle de STP, ce qui signifie que STP ne fonctionne pas sur ces ports. Cependant, REP et STP peuvent coexister sur un même commutateur, à condition qu'ils soient correctement configurés sur des interfaces distinctes.
Best Practice: https://www.cisco.com/c/fr_ca/support/docs/lan-switching/spanning-tree-protocol/212801-configure-and-validate-rep-with-stp.pdf
Sur le 3560: 13 juin 10:12:39 : %SYS-4-CHUNKSIBLINGSEXCEED : Le nombre de frères dans un bloc a dépassé le seuil. Seuil : 10 000 Nombre de frères : 22 945 Bloc : 0xB76FB8C Nom : REP notify Mult -Process= « Chunk Manager », ipl= 0, pid= 1
-Traceback= 903 600z 3519 260z 3519 500z 43C367Cz 43BF36Cz
--> Vérifier l'état de la mémoire_check version IOS au regard des possibles bug mémoire aussi... un redémarrage du châssis a été fait ? même pb à l'issue ?
Découvrez et enregistrez vos notes préférées. Revenez pour trouver les réponses d'experts, des guides étape par étape, des sujets récents et bien plus encore.
Êtes-vous nouveau ici? Commencez par ces conseils. Comment utiliser la communauté Guide pour les nouveaux membres
Parcourez les liens directs de la Communauté et profitez de contenus personnalisés en français