Desentrañando el Database Sharding en Cisco ACI APICs

tomy.tim · ‎12-07-2023

Introducción al mundo de los APIC de Cisco ACI
En el corazón de Cisco ACI (Application Centric Infrastructure) se encuentra un componente esencial conocido como APIC (Application Policy Infrastructure Controller). Este elemento clave se implementa en un clúster que constituye la columna vertebral de la gestión de políticas y la configuración de la red. Entre los elementos fundamentales de esta arquitectura se encuentra el concepto crucial de "Database Sharding", una práctica que merece la atención de los profesionales de TI para comprender plenamente cómo funciona esta potente tecnología.
En este artículo, exploraremos la arquitectura del Cisco APIC Cluster y la innovadora tecnología de base de datos que lo impulsa.
El clúster Cisco APIC:
Cisco APIC opera en un cluster formado por al menos tres controladores. La escalabilidad del clúster es directamente proporcional a las necesidades del despliegue ACI y se escala en función de los requisitos de velocidad de transacción. La belleza de este modelo reside en su flexibilidad, ya que cualquier controlador del clúster puede dar servicio a cualquier usuario para cualquier operación. Además, la adición o eliminación de controladores puede realizarse de forma transparente, lo que garantiza una gestión dinámica y adaptable. Los APIC forman un cluster y se comunican entre sí utilizando la red proporcionada por leaf y spine. Este eficaz enfoque permite la sincronización continua de políticas y configuraciones en todo el clúster, garantizando un entorno cohesionado e integrado.

Figura 1

Alta disponibilidad del APIC
Para un entorno de producción robusto, es esencial desplegar un mínimo de tres nodos APIC redundantes, pero la escalabilidad es flexible, permitiendo ampliar el clúster hasta siete nodos. En entornos de laboratorio, es factible gestionar la malla ACI incluso con un único nodo, siempre que esté correctamente configurado. La relación directa entre el número de nodos APIC y el número de conmutadores gestionados es crucial para conseguir el rendimiento deseado en la tasa de transacciones entre ellos. Según las directrices generales de escalabilidad de Cisco, se deben seguir las siguientes recomendaciones:

- Cluster de tres nodos: hasta 80 switches de hoja.
- Cluster de cuatro nodos: hasta 200 switches hoja.
- Clúster de cinco o seis nodos: hasta 400 conmutadores de hoja.
- Clúster de siete nodos: 400-500 conmutadores de hoja.
- Para implementaciones que requieran un número aún mayor de conmutadores, es aconsejable considerar la implementación de la arquitectura Multi-Site, utilizando varios clusters APIC.

El descubrimiento y la agrupación de APIC es un proceso automatizado basado en una configuración inicial coherente y en información LLDP. Como se ilustra en la Figura 2, un clúster APIC, crucial para la optimización del rendimiento, emplea la técnica de escalado horizontal de bases de datos denominada sharding. Un "fragmento" es esencialmente una unidad de datos, un subconjunto de la base de datos o un grupo de filas de la base de datos distribuidas entre los nodos del clúster para permitir el procesamiento paralelo y la protección de datos en caso de fallo. Cada fragmento de base de datos APIC tiene exactamente tres réplicas, distribuidas por el clúster en función de las disposiciones de fragmentos definidas para cada tamaño de clúster.
Los propios datos se colocan en los fragmentos como resultado de una función hash. Un APIC asume el papel de maestro (o líder del fragmento) en un fragmento específico y tiene derechos de lectura y escritura para editarlo; los otros dos se utilizan como réplicas de sólo lectura. Cuando un maestro queda inactivo, los APIC restantes negocian entre sí para determinar quién se convertirá en el nuevo maestro. Ahora podemos entender el origen del quórum APIC. Sólo los shards que tienen al menos una réplica de respaldo son escribibles, lo que justifica la necesidad de al menos dos de los tres APIC disponibles para configurar la estructura ICA.

Figure 2 APIC sharding

¡Pero ten cuidado! Al ampliar el número de nodos del clúster APIC a más de tres, es importante tener en cuenta que seguiremos manteniendo tres réplicas para cada fragmento. Por lo tanto, más nodos no equivalen necesariamente a más fiabilidad y redundancia. Cada APIC adicional contribuye principalmente a una mayor escalabilidad y a la capacidad de gestionar un mayor número de conmutadores en el tejido.
Analicemos un escenario con un clúster APIC más grande, formado por cinco nodos, durante un posible fallo. Si perdemos dos nodos, técnicamente seguimos manteniendo el quórum. Sin embargo, echa un vistazo a la Figura 3. Con esta disposición de fragmentos, algunos estarán en estado de sólo lectura, mientras que en otros todavía se puede escribir. Se recomienda encarecidamente evitar cualquier cambio en esta situación y priorizar la restauración del clúster lo antes posible. Si se pierden más de dos nodos, existe una alta probabilidad de que parte de la información se pierda de forma irreversible.

Figure 3 APIC Three+ node cluster failure

Tu objetivo debe ser siempre distribuir los APIC por la estructura ICA de forma que se garantice su protección frente a fallos de más de dos nodos a la vez. de más de dos nodos a la vez. Por supuesto, dentro de una única malla, no tienes mucho margen de maniobra. En este caso, pruebe a distribuir los nodos APIC en distintos bastidores (o filas) y a conectar cada uno de ellos a tomas de corriente independientes.
En arquitectura Multi-Pod, se recomienda conectar dos APIC en el Pod 1 y el tercer APIC en uno de los otros Pods. En situaciones adversas, existe la posibilidad de perder dos nodos, lo que provocaría la ausencia de quórum y un bucle ACI funcionando en modo de sólo lectura. Para sortear este reto, existe una alternativa que consiste en preparar y desplegar un APIC de reserva con antelación, tal y como se ilustra en la Figura 4. Este dispositivo hardware es idéntico al principal en términos de configuración inicial, recibiendo instrucciones de no formar un cluster con otros APICs. En su lugar, permanece en segundo plano, listo para entrar en acción en caso de fallo. Mientras está en modo de espera, el APIC no replica datos ni participa en operaciones ACI.
Sin embargo, el clúster principal es consciente de la presencia del APIC en espera y permite que los nodos que fallen sean sustituidos por él cuando sea necesario. El APIC activo replica su base de datos al APIC en espera, restableciendo un clúster de lectura y escritura para garantizar la continuidad del quórum.

Figure 4 Multi-Pod Standby APIC node

Si tiene previsto desplegar entre 80 y 200 hojas en el entorno Multi-Pod, puede obtener el mejor rendimiento y redundancia utilizando cuatro clusters de cuatro nodos, distribuidos en la medida de lo posible alrededor de los pods. En un proyecto con sólo dos pods, coloque un APIC de reserva adicional en cada pod.
Para un cluster de cinco nodos en MultiPOD, consulte la distribución recomendada que se muestra en la Tabla 5.

Tabela 5 Five-Node APIC Cluster in ACI Multi-Pod

*Nota: Cuando se pierden completamente algunos fragmentos durante la interrupción del POD1, aún existe la posibilidad de recuperar los datos mediante un procedimiento denominado Recuperación de ID. Utiliza instantáneas de configuración y debe realizarlo la unidad de negocio o el soporte técnico de Cisco.
Para un despliegue de ACI a gran escala que conste de más de 400 switches, debería implementarse una distribución de clúster APIC de siete nodos, como se muestra en la Tabla 6. El experto que analice este enfoque no desplegaría ese número de conmutadores y APIC en sólo dos nodos. Acabaría con cuatro nodos en el primer pod y, en caso de fallo, no hay garantías de que se pueda recuperar la configuración. Para mí, un mínimo seguro serían al menos cuatro pods.

Tabela 6 Seven-Node APIC Cluster in ACI Multi-Pod

*Nota: o mesmo procedimento de recuperação de ID também é aplicável aqui

El APIC como base de datos:
Cada servicio ACI se organiza y almacena como parte de una base de datos. Estos servicios se encapsulan en fragmentos, cada uno de los cuales se replica tres veces para garantizar una alta disponibilidad. Para cada fragmento hay un líder y dos seguidores, lo que contribuye a una arquitectura robusta y tolerante a fallos.

O estado do cluster do APIC deve permanecer sempre "Fully Fit", indicando a integridade de todos os APICs, conforme ilustrado na figura 2. Se o status de integridade de um ou mais controladores APIC no cluster não estiver completamente adequado, como "Camada de Dados Parcialmente Divergente", pode haver problemas na comunicação da infraestrutura do APIC ou nos processos do APIC. Nesse caso, é recomendável evitar qualquer modificação na configuração até que o problema seja devidamente diagnosticado e resolvido.

Figura 2

Al administrar el clúster Cisco APIC, se pueden llevar a cabo varias tareas, cada una de las cuales requiere un procedimiento específico:

1. Ampliación del tamaño del clúster APIC:
- Operación que aumenta el número configurado de APIC en el clúster de un tamaño de N a N+1, dentro de los límites legales.
- Durante la expansión, el descubrimiento y la expansión tienen lugar secuencialmente basándose en los números de ID de APIC. Inicialmente, se expande APIC1, seguido de APIC2, APIC3, y así sucesivamente.

2. Reducción del tamaño del cluster APIC:
- Operación que disminuye el número configurado de APICs, pasando de un tamaño de N a N-1, dentro de los límites legales.
- Durante la reducción, primero se debe desactivar el último APIC del cluster, siguiendo el camino secuencial inverso. Se empieza desactivando APIC4 (si es el último APIC ID), seguido de APIC3, APIC2 y finalmente APIC1.

3. Sustitución de un APIC en el cluster:
- Desactive el APIC que desea sustituir y ponga en marcha el APIC de sustitución utilizando la misma configuración e imagen que el APIC que se va a sustituir.

4. Preparación de un APIC en modo de espera fría en el clúster:
- Un APIC en espera proporciona una opción de espera en frío, recomendada en despliegues Cisco ACI Stretched Fabric o Multipod, donde la posibilidad de que se produzca una situación de APIC split-brain es mayor.
- Se recomienda tener al menos tres APIC activos en el clúster y uno o más APIC en espera.

5. Apagado y reinicio de APICs en el cluster:
- Cuando sea necesario, puede apagar los APIC del clúster, por ejemplo, trasladándolos a otra ubicación.
- Asegúrese de poner el APIC en línea lo antes posible y compruebe que todos los controladores del clúster vuelven a un estado de pleno funcionamiento.

Tecnología de bases de datos
Antes de adentrarnos en la explicación, siempre he querido entender el concepto de las tres réplicas que se aplica en la solución Cisco ACI, y para perseguir esta comprensión, me embarqué en un estudio en profundidad de Bases de Datos - Sharding. Sólo así pude aclarar completamente el tema.
Tecnología de bases de datos - Sharding:
Un componente clave en la escalabilidad de Cisco APIC Clustering es la tecnología de base de datos llamada sharding. La base de datos de configuración de APIC se divide en subconjuntos lógicos llamados shards, cada uno con tres réplicas para garantizar la redundancia y la resistencia. Estos shards se distribuyen uniformemente entre los APICs, promoviendo un equilibrio efectivo de la carga de trabajo.
Estos fragmentos se distribuyen entre los APIC utilizando una función hash predeterminada para determinar la asignación de datos. Este enfoque no sólo optimiza el rendimiento, sino que también aumenta la fiabilidad, ya que la pérdida de un APIC no compromete todo el sistema.

Escalabilidad y fiabilidad:
La fuerza de este enfoque reside en la capacidad de escalar dinámicamente a medida que crecen las necesidades. La función hash predeterminada y la disposición estática de los fragmentos determinan cómo se asignan los fragmentos a los dispositivos. Esta metodología específica de la base de datos proporciona una escalabilidad notable, lo que permite a APIC gestionar grandes conjuntos de datos de forma eficiente y fiable.

Por qué es mejor tener tres réplicas o más:
1. Resistencia a fallos:
Tener tres réplicas significa que incluso si una de ellas falla, seguimos teniendo dos copias disponibles. Esto crea una robustez fundamental que es esencial para mitigar fallos inesperados.
2. Disponibilidad continua:
Mantener tres réplicas ayuda a garantizar la disponibilidad continua de los servicios, incluso durante el mantenimiento planificado o fallos inesperados. Siempre tendremos al menos dos copias disponibles para satisfacer las demandas.
3. Recuperación rápida:
En caso de fallo, la recuperación es más rápida. Con tres copias, podemos restaurar la funcionalidad rápidamente, minimizando el impacto en las operaciones.

En resumen, la práctica de tener tres réplicas es una inversión en la fiabilidad y resistencia de los sistemas informáticos. No sólo protege contra fallos e interrupciones, sino que permite que las operaciones continúen sin problemas. Comprender el valor de la redundancia nos permite construir entornos informáticos más fiables y resistentes, fundamentales para el éxito de las organizaciones modernas.

La explicación de la fragmentación de la base de datos en el contexto del clustering de Cisco APIC implica entender cómo se gestiona la base de datos de configuración de APIC para ofrecer escalabilidad y fiabilidad. Vamos a dividir esta explicación en partes:
1. Formación de clústeres:
- El APIC (Application Policy Infrastructure Controller) de Cisco es una parte integral de la solución de redes definidas por software (SDN) de Cisco.
- La formación de clústeres en el contexto del APIC implica la creación de grupos de APIC que trabajan juntos para gestionar la infraestructura de red.
- Un clúster APIC consta de varios APIC activos designados y APIC en espera designados.

2. Latidos de APIC:
- Los heartbeats son señales periódicas que se envían entre los APIC de un cluster para comprobar la disponibilidad y el estado de cada APIC.
- Son esenciales para garantizar que cada APIC conoce el estado de los demás en el clúster.
- Si falla un APIC activo, los APIC en espera pueden asumir sus funciones para garantizar la continuidad de la gestión de la infraestructura.

3. Database Sharding:

- Sharding é uma técnica usada em bancos de dados para dividir grandes conjuntos de dados em partes menores chamadas shards.

- No caso do APIC, o banco de dados de configuração é particionado em subconjuntos lógicos chamados shards.

- Cada shard possui três réplicas para garantir redundância e resiliência.

- Esses shards são distribuídos de maneira uniforme entre os APICs no cluster.

4. Distribuição de Shards:

- A distribuição de shards entre os APICs é feita de forma a equilibrar a carga de trabalho e garantir eficiência operacional.

- Uma função de hash predeterminada é utilizada para determinar a atribuição de dados dos shards.

- Um layout de fragmento estático define como os shards são atribuídos a dispositivos específicos no cluster.

5.Benefícios da Tecnologia de Sharding:

- Escalabilidade: Permite que o sistema cresça de maneira eficiente à medida que mais recursos são necessários, distribuindo a carga de dados entre os APICs.

- Confiabilidade: A presença de réplicas de shards garante alta disponibilidade. Se um APIC falhar, os outros podem continuar a operação com as réplicas dos shards correspondentes.

Conclusiones:
En resumen, el clúster Cisco APIC de la infraestructura ACI representa la columna vertebral de la gestión de políticas, configuraciones y servicios. La combinación de la arquitectura de clúster dinámico y la tecnología de base de datos sharding ofrece una solución robusta, escalable y fiable para satisfacer las crecientes demandas de las redes modernas. Al comprender el funcionamiento interno de este ecosistema, los profesionales de redes pueden optimizar el rendimiento y la eficacia de sus infraestructuras. Cisco APIC Clustering no es sólo una respuesta a las necesidades actuales, sino también una preparación para los retos futuros en la evolución de las infraestructuras de red.

¿Qué ocurre si aún no se han instalado 3 APIC?
Cuando activas la malla Cisco ACI, puedes tener un solo APIC o dos APIC antes de tener un cluster completamente funcional. Este no es el estado final deseado, pero Cisco ACI le permite configurar la malla con un APIC o con dos APIC porque el bootstrap se considera una excepción.¿Qué ocurre si aún no se han instalado 3 APIC?
Cuando activas la malla Cisco ACI, puedes tener un solo APIC o dos APIC antes de tener un cluster completamente funcional. Este no es el estado final deseado, pero Cisco ACI le permite configurar la malla con un APIC o con dos APIC porque el bootstrap se considera una excepción.

- Cuando se inicia una malla con un único APIC, los fragmentos no son minoritarios porque el clúster aún no se ha ajustado por completo.
- Este es un caso especial diseñado para soportar Zero Touch Provisioning.
- Sólo hay una réplica de cada shard.
- El APIC creará nuevas réplicas en cuanto se añada un nuevo APIC.
- Esto explica por qué, cuando se instala la estructura ACI por primera vez, se puede utilizar la estructura incluso con un único APIC.

¿Qué ocurre si todos los APIC están inactivos?

El reenvío de tráfico persiste para las sesiones existentes y las nuevas. Algunas consideraciones importantes son:
- Las hojas operan de forma completamente autosuficiente en el reenvío de tráfico y la aplicación de políticas.
- Los fallos de enlace se recuperan automáticamente para garantizar la continuidad del servicio.
- La adición de nuevos endpoints puede o no tener éxito, dependiendo de la resolución y el momento de la implementación.
- La eficacia de Vmotion también está sujeta a la resolución y el momento de la implementación.
- En caso de problemas, como la necesidad de recuperar el Fabric ID, la existencia de una instantánea puede ser crucial. En tales casos, el Soporte Técnico de Cisco (TAC) o la Unidad de Negocio de Cisco (BU) pueden proporcionar asistencia para facilitar la recuperación.

Si te ha gustado el artículo, ¡no olvides dejar tu like o kudos!

Referencia:

https://www.linkedin.com/posts/janjanovic_cisco-aci-zero-to-hero-a-comprehensive-activity-7014321865728925696-tYyt/

https://www.ciscolive.com/on-demand/learning-maps/data-center/aci.html