¿Qué es exactamente una red Spine-Leaf? La red Spine-Leaf de redes subyacentes

Para satisfacer las necesidades de los servicios en la nube, la red se divide gradualmente en Underlay y Overlay. La red Underlay se compone del equipo físico, como el enrutamiento y la conmutación, propio de los centros de datos tradicionales, que prioriza la estabilidad y proporciona capacidades de transmisión de datos fiables. Overlay, por su parte, encapsula la red empresarial, más cercana al servicio, mediante la encapsulación con protocolos VXLAN o GRE, para ofrecer a los usuarios servicios de red fáciles de usar. Ambas redes, Underlay y Overlay, están interrelacionadas pero a la vez son independientes, pudiendo evolucionar de forma autónoma.

La red subyacente es la base de la red. Si la red subyacente es inestable, no hay acuerdo de nivel de servicio (SLA) para la empresa. Tras la arquitectura de red de tres capas y la arquitectura de red Fat-Tree, la arquitectura de red del centro de datos está migrando a la arquitectura Spine-Leaf, lo que marcó el inicio de la tercera aplicación del modelo de red CLOS.

Arquitectura de red de centro de datos tradicional

Diseño de tres capas

Entre 2004 y 2007, la arquitectura de red de tres niveles fue muy popular en los centros de datos. Consta de tres capas: la capa central (la columna vertebral de conmutación de alta velocidad de la red), la capa de agregación (que proporciona conectividad basada en políticas) y la capa de acceso (que conecta las estaciones de trabajo a la red). El modelo es el siguiente:

Modelo de 3 capas

Arquitectura de red de tres capas

Capa central: Los conmutadores centrales proporcionan un reenvío de paquetes de alta velocidad hacia y desde el centro de datos, conectividad con las múltiples capas de agregación y una red de enrutamiento L3 resiliente que normalmente da servicio a toda la red.

Capa de agregación: El conmutador de agregación se conecta al conmutador de acceso y proporciona otros servicios, como cortafuegos, descarga SSL, detección de intrusiones, análisis de red, etc.

Capa de acceso: Los conmutadores de acceso suelen estar en la parte superior del rack, por lo que también se les denomina conmutadores ToR (Top of Rack), y se conectan físicamente a los servidores.

Normalmente, el conmutador de agregación es el punto de demarcación entre las redes L2 y L3: la red L2 se encuentra por debajo del conmutador de agregación y la red L3 por encima. Cada grupo de conmutadores de agregación gestiona un punto de entrega (POD), y cada POD es una red VLAN independiente.

Bucle de red y protocolo de árbol de expansión

La formación de bucles se debe principalmente a la confusión causada por rutas de destino poco claras. Al construir redes, para garantizar la fiabilidad, los usuarios suelen utilizar dispositivos y enlaces redundantes, lo que inevitablemente genera bucles. La red de capa 2 se encuentra en el mismo dominio de difusión, y los paquetes de difusión se transmiten repetidamente dentro del bucle, formando una tormenta de difusión que puede provocar el bloqueo de puertos y la paralización de los equipos en un instante. Por lo tanto, para prevenir las tormentas de difusión, es necesario evitar la formación de bucles.

Para evitar la formación de bucles y garantizar la fiabilidad, solo es posible convertir los dispositivos y enlaces redundantes en dispositivos y enlaces de respaldo. Es decir, los puertos y enlaces de los dispositivos redundantes se bloquean en circunstancias normales y no participan en el reenvío de paquetes de datos. Únicamente cuando falla el dispositivo, puerto o enlace de reenvío actual, lo que provoca congestión en la red, se abrirán los puertos y enlaces de los dispositivos redundantes para que la red pueda restablecerse a la normalidad. Este control automático se implementa mediante el Protocolo de Árbol de Expansión (STP).

El protocolo de árbol de expansión opera entre la capa de acceso y la capa de destino, y su núcleo es un algoritmo de árbol de expansión que se ejecuta en cada puente habilitado para STP. Este algoritmo está diseñado específicamente para evitar bucles de puenteo en presencia de rutas redundantes. STP selecciona la mejor ruta de datos para reenviar mensajes y bloquea los enlaces que no forman parte del árbol de expansión, dejando solo una ruta activa entre dos nodos de red cualesquiera; el otro enlace ascendente se bloqueará.

Arquitectura de red de 3 capas

STP ofrece muchas ventajas: es sencillo, de fácil instalación y requiere muy poca configuración. Las máquinas dentro de cada pod pertenecen a la misma VLAN, por lo que el servidor puede migrar la ubicación arbitrariamente dentro del pod sin modificar la dirección IP ni la puerta de enlace.

Sin embargo, STP no puede utilizar rutas de reenvío paralelas, lo que siempre deshabilitará las rutas redundantes dentro de la VLAN. Desventajas de STP:

1. Convergencia lenta de la topología. Cuando cambia la topología de la red, el protocolo de árbol de expansión tarda entre 50 y 52 segundos en completar la convergencia de la topología.

2. No puede proporcionar la función de equilibrio de carga. Cuando hay un bucle en la red, el protocolo Spanning Tree solo puede bloquearlo, impidiendo que el enlace reenvíe paquetes de datos y desperdiciando recursos de la red.

Virtualización y desafíos del tráfico este-oeste

Después de 2010, para mejorar la utilización de los recursos informáticos y de almacenamiento, los centros de datos comenzaron a adoptar la tecnología de virtualización, y un gran número de máquinas virtuales empezaron a aparecer en la red. La tecnología de virtualización transforma un servidor en múltiples servidores lógicos; cada máquina virtual puede ejecutarse de forma independiente, tiene su propio sistema operativo, aplicación, dirección MAC y dirección IP independientes, y se conectan a la entidad externa a través del conmutador virtual (vSwitch) dentro del servidor.

La virtualización conlleva un requisito complementario: la migración en vivo de máquinas virtuales, es decir, la capacidad de trasladar un sistema de máquinas virtuales de un servidor físico a otro manteniendo el funcionamiento normal de los servicios en dichas máquinas. Este proceso no afecta a los usuarios finales; los administradores pueden asignar recursos del servidor de forma flexible, así como reparar y actualizar servidores físicos sin interrumpir el uso habitual por parte de los usuarios.

Para garantizar que el servicio no se interrumpa durante la migración, es necesario que no solo la dirección IP de la máquina virtual permanezca inalterada, sino que también se mantenga su estado de ejecución (como el estado de la sesión TCP). Por lo tanto, la migración dinámica de la máquina virtual solo puede realizarse dentro del mismo dominio de capa 2, pero no entre dominios de capa 2. Esto genera la necesidad de dominios L2 más amplios desde la capa de acceso hasta la capa central.

En la arquitectura tradicional de redes de capa 2 de gran tamaño, el punto de división entre L2 y L3 se encuentra en el switch central, y el centro de datos debajo del switch central constituye un dominio de difusión completo, es decir, la red L2. De esta manera, se logra la flexibilidad en el despliegue de dispositivos y la migración de ubicaciones, sin necesidad de modificar la configuración de IP y puerta de enlace. Las diferentes redes L2 (VLAN) se enrutan a través de los switches centrales. Sin embargo, bajo esta arquitectura, el switch central necesita mantener una enorme tabla MAC y ARP, lo que impone altos requisitos a su capacidad. Además, el switch de acceso (TOR) también limita la escala de toda la red. Esto, en última instancia, limita la escala de la red, su expansión y elasticidad, y genera problemas de latencia en la programación de las tres capas, lo que impide satisfacer las necesidades futuras del negocio.

Por otro lado, el tráfico este-oeste generado por la tecnología de virtualización también plantea desafíos para la red tradicional de tres capas. El tráfico del centro de datos se puede dividir a grandes rasgos en las siguientes categorías:

Tráfico norte-sur:Tráfico entre clientes fuera del centro de datos y el servidor del centro de datos, o tráfico desde el servidor del centro de datos a Internet.

Tráfico este-oeste:Tráfico entre servidores dentro de un centro de datos, así como tráfico entre diferentes centros de datos, como la recuperación ante desastres entre centros de datos y la comunicación entre nubes privadas y públicas.

La introducción de la tecnología de virtualización hace que el despliegue de aplicaciones sea cada vez más distribuido, y el "efecto secundario" es que el tráfico este-oeste está aumentando.

Las arquitecturas tradicionales de tres niveles suelen diseñarse para el tráfico norte-sur.Si bien puede utilizarse para el tráfico este-oeste, es posible que, en última instancia, no funcione según lo previsto.

 Arquitecturas tradicionales de tres niveles

Arquitectura tradicional de tres niveles frente a arquitectura de espina dorsal y hojas.

En una arquitectura de tres niveles, el tráfico este-oeste debe reenviarse a través de dispositivos en las capas de agregación y núcleo, pasando innecesariamente por numerosos nodos. (Servidor -> Acceso -> Agregación -> Conmutador de núcleo -> Agregación -> Conmutador de acceso -> Servidor)

Por lo tanto, si una gran cantidad de tráfico este-oeste se transmite a través de una arquitectura de red tradicional de tres niveles, los dispositivos conectados al mismo puerto del conmutador pueden competir por el ancho de banda, lo que resulta en tiempos de respuesta deficientes para los usuarios finales.

Desventajas de la arquitectura de red tradicional de tres capas

Se puede observar que la arquitectura de red tradicional de tres capas tiene muchas deficiencias:

Desperdicio de ancho de banda:Para evitar bucles, el protocolo STP se suele ejecutar entre la capa de agregación y la capa de acceso, de modo que solo un enlace ascendente del conmutador de acceso transporta tráfico, y los demás enlaces ascendentes se bloquean, lo que supone un desperdicio de ancho de banda.

Dificultad en la ubicación de redes a gran escala:Con la expansión de la escala de la red, los centros de datos se distribuyen en diferentes ubicaciones geográficas, las máquinas virtuales deben crearse y migrarse a cualquier lugar, y sus atributos de red, como las direcciones IP y las puertas de enlace, permanecen sin cambios, lo que requiere el soporte de una capa 2 robusta. En la estructura tradicional, no se puede realizar ninguna migración.

Falta de tráfico este-oeste:La arquitectura de red de tres niveles está diseñada principalmente para el tráfico norte-sur, aunque también admite el tráfico este-oeste, pero sus limitaciones son evidentes. Cuando el tráfico este-oeste es elevado, la presión sobre los conmutadores de la capa de agregación y la capa central aumenta considerablemente, y el tamaño y el rendimiento de la red se ven limitados por dichas capas.

Esto hace que las empresas caigan en el dilema del coste y la escalabilidad:El soporte de redes de alto rendimiento a gran escala requiere una gran cantidad de equipos de capa de convergencia y capa central, lo que no solo genera altos costos para las empresas, sino que también exige una planificación anticipada de la red durante su construcción. Cuando la escala de la red es pequeña, se produce un desperdicio de recursos, y a medida que la escala de la red continúa expandiéndose, la expansión se vuelve difícil.

Arquitectura de red de tipo espina-hoja
¿Qué es la arquitectura de red Spine-Leaf?
En respuesta a los problemas anteriores,Ha surgido un nuevo diseño de centro de datos, la arquitectura de red Spine-Leaf, que es lo que llamamos red de cresta de hoja.
Como su nombre indica, la arquitectura tiene una capa Spine y una capa Leaf, que incluyen conmutadores Spine y conmutadores Leaf.

 Arquitectura de red de espina y hoja

La arquitectura de espina dorsal y hoja

Cada interruptor de hoja está conectado a todos los interruptores de cresta, que no están conectados directamente entre sí, formando una topología de malla completa.
En la arquitectura spine-and-leaf, una conexión entre servidores pasa por el mismo número de dispositivos (Servidor -> Leaf -> Switch Spine -> Switch Leaf -> Servidor), lo que garantiza una latencia predecible. Esto se debe a que un paquete solo necesita pasar por un switch spine y otro leaf para llegar a su destino.

¿Cómo funciona Spine-Leaf?
Switch Leaf: Equivalente al switch de acceso en la arquitectura tradicional de tres niveles, se conecta directamente al servidor físico como TOR (Top Of Rack). La diferencia radica en que el punto de demarcación de la red L2/L3 se encuentra ahora en el switch Leaf. Este se ubica por encima de la red de tres niveles y por debajo del dominio de difusión L2 independiente, lo que resuelve el problema de BUM (Buys-Up-Middle) de las grandes redes de dos niveles. Si dos servidores Leaf necesitan comunicarse, deben usar enrutamiento L3 y reenviar la comunicación a través de un switch Spine.
Switch Spine: Equivalente a un switch central. ECMP (Equal Cost Multi Path) se utiliza para seleccionar dinámicamente múltiples rutas entre los switches Spine y Leaf. La diferencia radica en que el Spine ahora proporciona una red de enrutamiento L3 resiliente para el switch Leaf, de modo que el tráfico norte-sur del centro de datos se puede enrutar desde el switch Spine en lugar de directamente. El tráfico norte-sur se puede enrutar desde el switch de borde en paralelo al switch Leaf hasta el enrutador WAN.

 Arquitectura de red Spine-Leaf frente a la arquitectura de red tradicional de tres capas.

Comparación entre la arquitectura de red Spine/Leaf y la arquitectura de red tradicional de tres capas.

Ventajas de la hoja espinosa
Departamento:Un diseño plano acorta la ruta de comunicación entre servidores, lo que reduce la latencia y puede mejorar significativamente el rendimiento de las aplicaciones y los servicios.
Buena escalabilidad:Cuando el ancho de banda es insuficiente, aumentar el número de conmutadores de cresta permite extenderlo horizontalmente. Si la densidad de puertos es insuficiente, al aumentar el número de servidores, podemos añadir conmutadores de hoja.
Reducción de costos: Tráfico en dirección norte y sur, con salida desde nodos hoja o desde nodos cresta. Flujo este-oeste distribuido en múltiples rutas. De esta forma, la red hoja-cresta puede utilizar conmutadores de configuración fija sin necesidad de costosos conmutadores modulares, reduciendo así los costos.
Baja latencia y prevención de la congestión:En una red Leaf Ridge, los flujos de datos mantienen el mismo número de saltos a través de la red, independientemente del origen y el destino. Dos servidores cualesquiera son accesibles entre sí mediante tres saltos (Leaf -> Spine -> Leaf). Esto establece una ruta de tráfico más directa, lo que mejora el rendimiento y reduce los cuellos de botella.
Alta seguridad y disponibilidad:El protocolo STP se utiliza en la arquitectura de red tradicional de tres niveles. Cuando un dispositivo falla, se produce una reconvergencia, lo que afecta al rendimiento de la red o incluso puede provocar su fallo. En la arquitectura leaf-ridge, cuando un dispositivo falla, no es necesario reconverger y el tráfico continúa fluyendo por otras rutas normales. La conectividad de la red no se ve afectada y el ancho de banda solo se reduce en una ruta, con un impacto mínimo en el rendimiento.
El balanceo de carga mediante ECMP es ideal para entornos donde se utilizan plataformas de gestión de red centralizadas como SDN. SDN permite simplificar la configuración, la gestión y el redireccionamiento del tráfico en caso de bloqueo o fallo de enlace, lo que convierte la topología de malla completa con balanceo de carga inteligente en una forma relativamente sencilla de configurar y gestionar.

Sin embargo, la arquitectura Spine-Leaf tiene algunas limitaciones:
Una desventaja es que el número de conmutadores aumenta el tamaño de la red. El centro de datos de una arquitectura de red leaf-ridge necesita incrementar los conmutadores y el equipo de red proporcionalmente al número de clientes. A medida que aumenta el número de hosts, se requiere un gran número de conmutadores leaf para conectarse al conmutador ridge.
La interconexión directa de conmutadores de cresta y de hoja requiere compatibilidad, y en general, la relación de ancho de banda razonable entre conmutadores de hoja y de cresta no puede exceder de 3:1.
Por ejemplo, hay 48 clientes de 10 Gbps en el switch leaf con una capacidad total de puerto de 480 Gb/s. Si los cuatro puertos de enlace ascendente de 40 G de cada switch leaf se conectan al switch ridge de 40 G, tendrá una capacidad de enlace ascendente de 160 Gb/s. La relación es 480:160, o 3:1. Los enlaces ascendentes de los centros de datos suelen ser de 40 G o 100 G y pueden migrarse con el tiempo desde un punto de partida de 40 G (Nx 40 G) a 100 G (Nx 100 G). Es importante tener en cuenta que el enlace ascendente siempre debe funcionar más rápido que el enlace descendente para no bloquear el enlace del puerto.

 relación de ancho de banda del conmutador Spine-Leaf

Las redes Spine-Leaf también tienen requisitos de cableado específicos. Dado que cada nodo leaf debe conectarse a cada switch spine, se requiere instalar más cables de cobre o fibra óptica. La distancia de interconexión incrementa el costo. Dependiendo de la distancia entre los switches interconectados, la cantidad de módulos ópticos de alta gama que requiere la arquitectura Spine-Leaf es decenas de veces mayor que la de la arquitectura tradicional de tres niveles, lo que aumenta el costo total de implementación. Sin embargo, esto ha impulsado el crecimiento del mercado de módulos ópticos, especialmente de alta velocidad, como los de 100G y 400G.


Fecha de publicación: 26 de enero de 2026