La solución de “micro ráfagas” en el escenario de aplicación de captura de tráfico de red de derivación

En el escenario típico de una aplicación NPB, el problema más problemático para los administradores es la pérdida de paquetes causada por la congestión de los paquetes reflejados y las redes NPB. La pérdida de paquetes en NPB puede causar los siguientes síntomas típicos en las herramientas de análisis de backend:

- Se genera una alarma cuando el indicador de monitoreo del rendimiento del servicio APM disminuye y la tasa de éxito de las transacciones disminuye.

- Se genera la alarma de excepción del indicador de monitoreo de rendimiento de red NPM

- El sistema de monitoreo de seguridad no detecta ataques a la red debido a la omisión de eventos

- Pérdida de eventos de auditoría del comportamiento del servicio generados por el sistema de auditoría del servicio

... ...

Como sistema centralizado de captura y distribución para la monitorización de bypass, la importancia del NPB es evidente. Al mismo tiempo, su procesamiento del tráfico de paquetes de datos es bastante diferente al de un conmutador de red en vivo tradicional, y la tecnología de control de congestión de tráfico de muchas redes de servicio en vivo no es aplicable al NPB. Para resolver la pérdida de paquetes del NPB, comencemos por el análisis de la causa raíz.

Análisis de la causa raíz de la congestión por pérdida de paquetes NPB/TAP

En primer lugar, analizamos la ruta de tráfico real y la relación de mapeo entre el sistema y las entradas y salidas de la red de nivel 1 o NPB. Independientemente de la topología de red que forme NPB, como sistema de recopilación, existe una relación de entrada y salida de tráfico de muchos a muchos entre el acceso y la salida de todo el sistema.

Micro ráfaga 1

A continuación analizamos el modelo de negocio de NPB desde la perspectiva de los chips ASIC en un solo dispositivo:

Micro ráfaga 2

Característica 1El tráfico y la tasa de interfaz física de las interfaces de entrada y salida son asimétricos, lo que resulta inevitablemente en un gran número de microrráfagas. En escenarios típicos de agregación de tráfico de muchos a uno o de muchos a muchos, la tasa física de la interfaz de salida suele ser menor que la tasa física total de la interfaz de entrada. Por ejemplo, 10 canales de recolección de 10G y 1 canal de salida de 10G. En un escenario de implementación multinivel, todos los NPBBS pueden considerarse como un todo.

Característica 2Los recursos de caché de los chips ASIC son muy limitados. En cuanto a los chips ASIC más comunes actualmente, un chip con una capacidad de intercambio de 640 Gbps tiene una caché de 3 a 10 MB; un chip con una capacidad de 3,2 Tbps tiene una caché de 20 a 50 MB. Esto incluye a BroadCom, Barefoot, CTC, Marvell y otros fabricantes de chips ASIC.

Característica 3El mecanismo convencional de control de flujo PFC de extremo a extremo no es aplicable a los servicios NPB. Su objetivo principal es lograr la retroalimentación de supresión de tráfico de extremo a extremo y, en última instancia, reducir el envío de paquetes a la pila de protocolos del punto final de comunicación para aliviar la congestión. Sin embargo, el origen de los paquetes de los servicios NPB son paquetes reflejados, por lo que la estrategia de procesamiento de la congestión solo puede descartarse o almacenarse en caché.

La siguiente es la apariencia de una microrráfaga típica en la curva de flujo:

Micro ráfaga 3

Tomando como ejemplo la interfaz 10G, en el diagrama de análisis de tendencias de tráfico de segundo nivel, la velocidad de tráfico se mantiene en torno a los 3 Gbps durante un periodo prolongado. En el gráfico de análisis de tendencias de micromilisegundos, el pico de tráfico (microrráfaga) ha superado con creces la velocidad física de la interfaz 10G.

Técnicas clave para mitigar las micro ráfagas de NPB

Reducir el impacto del desajuste de velocidad de la interfaz física asimétricaAl diseñar una red, reduzca al máximo las velocidades asimétricas de las interfaces físicas de entrada y salida. Un método típico consiste en utilizar un enlace de interfaz de enlace ascendente de mayor velocidad y evitar las velocidades asimétricas de las interfaces físicas (por ejemplo, copiar tráfico de 1 Gbit/s y 10 Gbit/s simultáneamente).

Optimizar la política de gestión de caché del servicio NPBLa política común de gestión de caché aplicable al servicio de conmutación no aplica al servicio de reenvío del servicio NPB. La política de gestión de caché de garantía estática y compartición dinámica debe implementarse según las características del servicio NPB. Para minimizar el impacto de las microrráfagas de NPB, dadas las limitaciones actuales del entorno de hardware del chip.

Implementar la gestión de ingeniería de tráfico clasificadoImplementar la gestión de la clasificación de servicios de ingeniería de tráfico prioritario según la clasificación del tráfico. Garantizar la calidad del servicio de las diferentes colas de prioridad según el ancho de banda de las colas de categoría y asegurar que los paquetes de tráfico de servicio sensibles al usuario se reenvíen sin pérdida de paquetes.

Una solución de sistema razonable mejora la capacidad de almacenamiento en caché de paquetes y la capacidad de modelado del tráfico.Integra la solución mediante diversos medios técnicos para ampliar la capacidad de almacenamiento en caché de paquetes del chip ASIC. Al moldear el flujo en diferentes ubicaciones, la microrráfaga se convierte en una curva de flujo microuniforme tras el moldeo.

Solución de gestión de tráfico de micro ráfagas Mylinking™

Esquema 1: Estrategia de gestión de caché optimizada para la red + gestión de prioridades de calidad de servicio clasificado en toda la red

Estrategia de gestión de caché optimizada para toda la red

Basándose en un profundo conocimiento de las características del servicio NPB y los escenarios comerciales prácticos de un gran número de clientes, los productos de recolección de tráfico Mylinking™ implementan una estrategia de gestión de caché NPB de "aseguramiento estático + compartición dinámica" para toda la red, lo que resulta beneficioso para la gestión de la caché de tráfico en caso de un gran número de interfaces de entrada y salida asimétricas. La tolerancia a microrráfagas se alcanza al máximo cuando la caché actual del chip ASIC es fija.

Tecnología de procesamiento de microrráfagas: gestión basada en prioridades empresariales

Micro ráfaga 4

Cuando la unidad de captura de tráfico se implementa de forma independiente, también se puede priorizar según la importancia de la herramienta de análisis back-end o de los propios datos del servicio. Por ejemplo, entre muchas herramientas de análisis, APM/BPC tiene mayor prioridad que las herramientas de análisis/monitoreo de seguridad, ya que implica el monitoreo y análisis de diversos indicadores de sistemas empresariales importantes. Por lo tanto, en este escenario, los datos requeridos por APM/BPC pueden definirse como de alta prioridad, los datos requeridos por las herramientas de monitoreo/análisis de seguridad, como de prioridad media, y los datos requeridos por otras herramientas de análisis, como de baja prioridad. Cuando los paquetes de datos recopilados entran en el puerto de entrada, las prioridades se definen según su importancia. Los paquetes de mayor prioridad se reenvían preferentemente después de los paquetes de mayor prioridad, y los paquetes de otras prioridades se reenvían después de los paquetes de mayor prioridad. Si continúan llegando paquetes de mayor prioridad, se reenvían preferentemente los de mayor prioridad. Si los datos de entrada superan la capacidad de reenvío del puerto de salida durante un período prolongado, el exceso se almacena en la caché del dispositivo. Si la caché está llena, el dispositivo descarta preferentemente los paquetes de menor orden. Este mecanismo de gestión priorizada garantiza que las herramientas de análisis clave puedan obtener eficientemente los datos de tráfico originales necesarios para el análisis en tiempo real.

Tecnología de procesamiento de microrráfagas: mecanismo de garantía de clasificación de la calidad del servicio de toda la red

Micro ráfaga 5

Como se muestra en la figura anterior, la tecnología de clasificación de tráfico se utiliza para distinguir los diferentes servicios en todos los dispositivos de la capa de acceso, la capa de agregación/núcleo y la capa de salida, y se remarcan las prioridades de los paquetes capturados. El controlador SDN proporciona la política de prioridad de tráfico de forma centralizada y la aplica a los dispositivos de reenvío. Todos los dispositivos que participan en la red se asignan a diferentes colas de prioridad según las prioridades de los paquetes. De esta forma, los paquetes de prioridad avanzada con poco tráfico pueden lograr una pérdida de paquetes cero. Esto soluciona eficazmente el problema de la pérdida de paquetes en la monitorización de APM y los servicios de tráfico de omisión de auditoría de servicios especiales.

Solución 2: Expansión de caché del sistema a nivel de GB + Esquema de modelado de tráfico
Caché extendida del sistema de nivel GB
Gracias a las avanzadas capacidades de procesamiento funcional de nuestra unidad de adquisición de tráfico, se puede liberar espacio en la memoria RAM como búfer global, lo que mejora considerablemente su capacidad. Para un solo dispositivo de adquisición, se pueden proporcionar al menos GB de caché. Esta tecnología multiplica por cientos la capacidad del búfer de nuestra unidad de adquisición de tráfico por la de los dispositivos tradicionales. Con la misma velocidad de reenvío, la duración máxima de microrráfagas de nuestra unidad de adquisición de tráfico se incrementa. El nivel de milisegundos que admiten los equipos de adquisición tradicionales se ha elevado al segundo nivel, y el tiempo de microrráfaga que soportan se ha multiplicado por miles.

Capacidad de modelado de tráfico de múltiples colas

Tecnología de procesamiento de microrráfagas: una solución basada en almacenamiento en caché de búfer grande + modelado de tráfico

Micro ráfaga 6

Gracias a una capacidad de búfer extremadamente grande, los datos de tráfico generados por microrráfagas se almacenan en caché, y la tecnología de modelado de tráfico se utiliza en la interfaz de salida para lograr una salida fluida de paquetes a la herramienta de análisis. Gracias a esta tecnología, se soluciona fundamentalmente el problema de la pérdida de paquetes causada por microrráfagas.


Hora de publicación: 27 de febrero de 2024