annuler
Affichage des résultats de 
Rechercher plutôt 
Vouliez-vous dire : 
cancel
84
Visites
0
Compliment
1
Réponses

rrp défaillant

sylv-guiton
Level 1
Level 1

Je te transmets à nouveau le message que j'avais préparé pour Cisco suite à notre conversation. Je ne sais pas pourquoi, il n'est pas parti de ma boîte la première fois : 

REP Instability & Spanning-Tree Compatibility Issue in Cisco Network

 

Dear Cisco Technical Team,

We are experiencing significant instability in our network, which consists of two Cisco 9500 core switches and multiple Cisco Catalyst 3560 nodes configured in a REP (Resilient Ethernet Protocol) + HSRP (Hot Standby Router Protocol) architecture. Our infrastructure is built on two ring topologies, and we are facing recurring issues that cause service interruptions and performance degradation.

  1. Issue Summary

We have observed the following log entries on both the 3560 node switches and 9500 core switches:

Log from a 3560 Switch

Jun 13 10:12:39: %SYS-4-CHUNKSIBLINGSEXCEED: Number of siblings in a chunk has gone above the threshold. Threshold:10000 Sibling-Count:22945 Chunk:0xB76FB8C Name:REP notify Mult -Process= "Chunk Manager", ipl= 0, pid= 1-Traceback= 903600z 3519260z 3519500z 43C367Cz 43BF36Cz

Logs from the 9500 Switches

*Jun 13 08:42:53: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is non-operational due to neighbor not responding*Jun 13 08:42:53: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is operational*Jun 13 08:42:55: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is non-operational due to neighbor not responding*Jun 13 08:42:56: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/1 (segment 1) is operational...*Jun 13 09:02:05: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/2 (segment 2) is non-operational due to neighbor not responding*Jun 13 09:02:06: %REP-4-LINKSTATUS: TwentyFiveGigE1/0/2 (segment 2) is operational

These logs indicate frequent instability on segments 1 and 2, where links alternate between operational and non-operational states due to neighbor communication issues.

  1. Investigation & Key Findings
  • Spanning-Tree (Rapid-PVST) & REP Coexistence:
    During troubleshooting, we noticed that Rapid-PVST is enabled by default on all switches. We suspect that having both REP and Spanning-Tree enabled may be causing protocol conflicts.
    However, our pre-sales information indicated that REP is interoperable with STP. Could you please confirm if this coexistence is problematic? If not, what is the best practice for ensuring both protocols operate smoothly?
  1. Next Steps
  • Awaiting Cisco’s Confirmation on REP & Spanning-Tree:
    We need Cisco's guidance on the recommended approach for handling REP and STP coexistence.
    If necessary, we will plan a maintenance window to disable Spanning-Tree on REP loops in General Services. However, this change could have a global impact on the LUMEN network.
  • Further Coordination:
    We will adjust our action plan based on Cisco’s recommendations to ensure network stability without unexpected service disruptions.
  1. Equipment Details

To facilitate troubleshooting, here are the details of our core switches and node switches:

Cisco Catalyst 3560

  • Model Number: WS-C3560CX-12PD-S
  • Serial Number: FOC2535Y06Q

Cisco Catalyst 9500

  • Model Number: C9500-24Y4C
  • Serial Number: FDO25461GSF

Attachments:

  • Network topology diagram
  • Show run outputs for:
    • One 3560 node
    • Two 9500 core switches

Conclusion

We have identified a potential protocol conflict between REP and Spanning-Tree, leading to network instability. While other issues (MTU mismatch, VRF, VLAN adjustments) have been resolved, we now need Cisco’s expert input to determine the best way forward.

We appreciate your guidance and recommendations to help us stabilize the network.

Best regards,

Je te transmets à nouveau le message que j'avais préparé pour la suite Cisco à notre conversation. Je ne sais pas pourquoi, il n'est pas parti de ma boîte la première fois :

Problème d'instabilité REP et de compatibilité Spanning-Tree dans le réseau Cisco

Chère équipe technique Cisco,
Nous rencontrons une instabilité importante dans notre réseau, qui se compose de deux commutateurs centraux Cisco 9500 et de plusieurs nœuds Cisco Catalyst 3560 configurés dans une architecture REP (Resilient Ethernet Protocol) + HSRP (Hot Standby Router Protocol). Notre infrastructure est construite sur deux topologies en anneau, et nous sommes confrontés à des problèmes récurrents qui provoquent des interruptions de service et une dégradation des performances.
________________________________________
1. Résumé du problème
Nous avons observé les entrées de journal suivantes sur les commutateurs de nœuds 3560 et les commutateurs centraux 9500 :
Journal d'un commutateur 3560
13 juin 10:12:39 : %SYS-4-CHUNKSIBLINGSEXCEED : Le nombre de frères dans un bloc a dépassé le seuil. Seuil : 10 000 Nombre de frères : 22 945 Bloc : 0xB76FB8C Nom : REP notify Mult -Process= « Chunk Manager », ipl= 0, pid= 1
-Traceback= 903 600z 3519 260z 3519 500z 43C367Cz 43BF36Cz
Journaux des commutateurs 9500
*13 juin 08:42:53 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est non opérationnel car le voisin ne répond pas
*13 juin 08:42:53 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est opérationnel
*13 juin 08:42:55 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est hors service en raison d'une absence de réponse du voisin
*13 juin 08:42:56 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/1 (segment 1) est opérationnel
...
*13 juin 09:02:05 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/2 (segment 2) est hors service en raison d'une absence de réponse du voisin
*13 juin 09:02:06 : %REP-4-LINKSTATUS : TwentyFiveGigE1/0/2 (segment 2) est opérationnel
Ces journaux indiquent une instabilité fréquente sur les segments 1 et 2, où les liaisons alternent entre des états opérationnels et non opérationnels en raison de problèmes de communication avec les voisins. ________________________________________
2. Enquête et principaux résultats
• Coexistence de Spanning Tree (Rapid-PVST) et de REP :
Lors du dépannage, nous avons constaté que Rapid-PVST est activé par défaut sur tous les commutateurs. Nous soupçonnons que l'activation simultanée de REP et de Spanning Tree peut être à l'origine de conflits de protocoles.
Cependant, nos informations avant-vente indiquaient que REP est interopérable avec STP. Pourriez-vous confirmer si cette coexistence pose problème ? Dans le cas contraire, quelle est la meilleure pratique pour garantir le bon fonctionnement des deux protocoles ?
________________________________________
3. Prochaines étapes
• En attente de la confirmation de Cisco concernant REP et Spanning Tree :
Nous avons besoin des conseils de Cisco sur l'approche recommandée pour gérer la coexistence de REP et de STP.
Si nécessaire, nous planifierons une période de maintenance pour désactiver Spanning Tree sur les boucles REP dans les services généraux. Cependant, ce changement pourrait avoir un impact global sur le réseau LUMEN.
• Coordination supplémentaire :
Nous ajusterons notre plan d’action en fonction des recommandations de Cisco afin de garantir la stabilité du réseau sans interruption de service imprévue.
________________________________________
4. Détails de l’équipement
Pour faciliter le dépannage, voici les détails de nos commutateurs principaux et de nos commutateurs de nœuds :
Cisco Catalyst 3560
• Numéro de modèle : WS-C3560CX-12PD-S
• Numéro de série : FOC2535Y06Q
Cisco Catalyst 9500
• Numéro de modèle : C9500-24Y4C
• Numéro de série : FDO25461GSF
Pièces jointes :
• Diagramme de topologie du réseau
• Afficher les résultats d’exécution pour :
o Un nœud 3560
o Deux commutateurs principaux 9500
________________________________________
Conclusion
Nous avons identifié un conflit de protocole potentiel entre REP et Spanning Tree, entraînant une instabilité du réseau. Bien que d'autres problèmes (inadéquation MTU, VRF, ajustements VLAN) aient été résolus, nous avons désormais besoin de l'avis des experts de Cisco pour déterminer la meilleure solution.
Nous vous remercions de vos conseils et recommandations pour nous aider à stabiliser le réseau.
Cordialement,

1 RÉPONSE 1

M02@rt37
VIP
VIP

Bonjour @sylv-guiton 

Les ports configurés pour REP sont retirés du contrôle de STP, ce qui signifie que STP ne fonctionne pas sur ces ports. Cependant, REP et STP peuvent coexister sur un même commutateur, à condition qu'ils soient correctement configurés sur des interfaces distinctes.

Best Practice: https://www.cisco.com/c/fr_ca/support/docs/lan-switching/spanning-tree-protocol/212801-configure-and-validate-rep-with-stp.pdf

Sur le 3560: 13 juin 10:12:39 : %SYS-4-CHUNKSIBLINGSEXCEED : Le nombre de frères dans un bloc a dépassé le seuil. Seuil : 10 000 Nombre de frères : 22 945 Bloc : 0xB76FB8C Nom : REP notify Mult -Process= « Chunk Manager », ipl= 0, pid= 1
-Traceback= 903 600z 3519 260z 3519 500z 43C367Cz 43BF36Cz

--> Vérifier l'état de la mémoire_check version IOS au regard des possibles bug mémoire aussi... un redémarrage du châssis a été fait ? même pb à l'issue ?

 

Best regards
.ı|ı.ı|ı. If This Helps, Please Rate .ı|ı.ı|ı.