En el escenario típico de aplicación de NPB, el problema más preocupante para los administradores es la pérdida de paquetes causada por la congestión de los paquetes duplicados y las redes NPB. La pérdida de paquetes en NPB puede provocar los siguientes síntomas típicos en las herramientas de análisis de back-end:
- Se genera una alarma cuando el indicador de monitorización del rendimiento del servicio APM disminuye y la tasa de éxito de las transacciones disminuye.
- Se genera la alarma de excepción del indicador de monitorización del rendimiento de la red NPM.
- El sistema de monitoreo de seguridad no detecta los ataques a la red debido a la omisión de eventos.
- Eventos de auditoría de comportamiento de pérdida de servicio generados por el sistema de auditoría de servicio.
... ...
Como sistema centralizado de captura y distribución para la monitorización de desvíos, la importancia de NPB es evidente. Sin embargo, su procesamiento del tráfico de paquetes de datos difiere considerablemente del de los conmutadores de red tradicionales, y la tecnología de control de congestión de tráfico de muchas redes de servicio no es aplicable a NPB. Para solucionar la pérdida de paquetes en NPB, ¡comencemos por analizar la causa raíz!
Análisis de la causa raíz de la congestión por pérdida de paquetes NPB/TAP
En primer lugar, analizamos la ruta de tráfico real y la relación de mapeo entre el sistema y el tráfico entrante y saliente de la red NPB de nivel 1. Independientemente de la topología de red que adopte NPB, como sistema de recolección, existe una relación de muchos a muchos entre el acceso y la salida de todo el sistema.
A continuación, analizamos el modelo de negocio de NPB desde la perspectiva de los chips ASIC en un único dispositivo:
Característica 1La asimetría del tráfico y de la velocidad de la interfaz física de las interfaces de entrada y salida provoca inevitablemente un gran número de microráfagas. En escenarios típicos de agregación de tráfico de muchos a uno o de muchos a muchos, la velocidad física de la interfaz de salida suele ser menor que la velocidad física total de la interfaz de entrada. Por ejemplo, 10 canales de recolección de 10 G y 1 canal de salida de 10 G; en un escenario de despliegue multinivel, todos los NPBBS pueden considerarse como un todo.
Característica 2Los recursos de caché de los chips ASIC son muy limitados. En cuanto a los chips ASIC de uso común, un chip con una capacidad de intercambio de 640 Gbps tiene una caché de 3 a 10 MB; un chip con una capacidad de 3,2 Tbps tiene una caché de 20 a 50 MB. Esto incluye a fabricantes como Broadcom, Barefoot, CTC, Marvell y otros.
Característica 3El mecanismo convencional de control de flujo PFC de extremo a extremo no es aplicable a los servicios NPB. El núcleo del mecanismo de control de flujo PFC consiste en lograr una retroalimentación de supresión de tráfico de extremo a extremo y, en última instancia, reducir el envío de paquetes a la pila de protocolos del punto final de comunicación para aliviar la congestión. Sin embargo, dado que el origen de los paquetes de los servicios NPB son paquetes duplicados, la estrategia de procesamiento de la congestión solo puede consistir en descartarlos o almacenarlos en caché.
A continuación se muestra el aspecto de una microrráfaga típica en la curva de flujo:
Tomando como ejemplo la interfaz de 10G, en el diagrama de análisis de tendencias de tráfico de segundo nivel, la tasa de tráfico se mantiene en aproximadamente 3 Gbps durante un largo período. En el gráfico de análisis de tendencias de micro milisegundos, el pico de tráfico (MicroBurst) ha superado ampliamente la tasa física de la interfaz de 10G.
Técnicas clave para mitigar las microrráfagas de NPB
Reducir el impacto del desajuste de velocidad de la interfaz física asimétricaAl diseñar una red, reduzca al máximo las tasas asimétricas de las interfaces físicas de entrada y salida. Un método habitual consiste en utilizar un enlace de interfaz de subida de mayor velocidad y evitar las tasas asimétricas de las interfaces físicas (por ejemplo, copiar tráfico de 1 Gbit/s y 10 Gbit/s simultáneamente).
Optimizar la política de gestión de caché del servicio NPB.La política de gestión de caché común aplicable al servicio de conmutación no es aplicable al servicio de reenvío del servicio NPB. Se debe implementar una política de gestión de caché de garantía estática + compartición dinámica en función de las características del servicio NPB, con el fin de minimizar el impacto de las microráfagas de NPB bajo las limitaciones del entorno de hardware del chip actual.
Implementar la gestión de ingeniería de tráfico clasificadaImplementar la gestión de clasificación de servicios de ingeniería de tráfico prioritarios basada en la clasificación del tráfico. Garantizar la calidad del servicio de las diferentes colas de prioridad según el ancho de banda de las colas de categoría y asegurar que los paquetes de tráfico de servicios sensibles al usuario se puedan reenviar sin pérdida de paquetes.
Una solución de sistema razonable mejora la capacidad de almacenamiento en caché de paquetes y la capacidad de modelado de tráfico.- Integra la solución mediante diversos medios técnicos para ampliar la capacidad de almacenamiento en caché de paquetes del chip ASIC. Al dar forma al flujo en diferentes ubicaciones, la microráfaga se convierte en una curva de flujo microuniforme después de la conformación.
Solución de gestión de tráfico de microráfagas Mylinking™
Esquema 1: Estrategia de gestión de caché optimizada para la red + gestión de prioridades de calidad de servicio clasificada en toda la red.
Estrategia de gestión de caché optimizada para toda la red.
Basándose en un profundo conocimiento de las características del servicio NPB y en escenarios comerciales prácticos de un gran número de clientes, los productos de recopilación de tráfico Mylinking™ implementan una estrategia de gestión de caché NPB de "garantía estática + compartición dinámica" para toda la red, lo que resulta eficaz para la gestión de la caché de tráfico en el caso de un gran número de interfaces de entrada y salida asimétricas. La tolerancia a las microráfagas se alcanza al máximo cuando la caché del chip ASIC actual es fija.
Tecnología de procesamiento de microrráfagas: gestión basada en prioridades empresariales.
Cuando la unidad de captura de tráfico se implementa de forma independiente, también se puede priorizar según la importancia de la herramienta de análisis de back-end o la importancia de los datos del servicio en sí. Por ejemplo, entre muchas herramientas de análisis, APM/BPC tiene mayor prioridad que las herramientas de análisis/monitoreo de seguridad, ya que implica el monitoreo y análisis de diversos datos indicadores de sistemas empresariales importantes. Por lo tanto, para este escenario, los datos requeridos por APM/BPC se pueden definir como de alta prioridad, los datos requeridos por las herramientas de monitoreo/análisis de seguridad como de prioridad media, y los datos requeridos por otras herramientas de análisis como de baja prioridad. Cuando los paquetes de datos recopilados ingresan al puerto de entrada, las prioridades se definen según la importancia de los paquetes. Los paquetes de mayor prioridad se reenvían preferentemente después de que se hayan reenviado los paquetes de mayor prioridad, y los paquetes de otras prioridades se reenvían después de que se hayan reenviado los paquetes de mayor prioridad. Si continúan llegando paquetes de mayor prioridad, estos se reenvían preferentemente. Si los datos de entrada superan la capacidad de reenvío del puerto de salida durante un período prolongado, el exceso de datos se almacena en la caché del dispositivo. Si la caché está llena, el dispositivo descarta preferentemente los paquetes de menor prioridad. Este mecanismo de gestión priorizada garantiza que las herramientas de análisis clave puedan obtener de forma eficiente los datos de tráfico originales necesarios para el análisis en tiempo real.
Tecnología de procesamiento de microráfagas: mecanismo de garantía de clasificación de la calidad del servicio de toda la red.
Como se muestra en la figura anterior, la tecnología de clasificación de tráfico se utiliza para distinguir los diferentes servicios en todos los dispositivos de las capas de acceso, agregación/núcleo y salida, y se remarcan las prioridades de los paquetes capturados. El controlador SDN entrega la política de prioridad de tráfico de forma centralizada y la aplica a los dispositivos de reenvío. Todos los dispositivos que participan en la red se asignan a diferentes colas de prioridad según las prioridades de los paquetes. De esta manera, los paquetes de baja prioridad avanzada pueden lograr una pérdida de paquetes nula. Esto resuelve eficazmente el problema de pérdida de paquetes de los servicios de tráfico de omisión de auditoría de servicios especiales y de monitorización APM.
Solución 2: Sistema de caché de expansión a nivel de GB + Esquema de modelado de tráfico
Caché extendida del sistema de niveles GB
Cuando la unidad de adquisición de tráfico cuenta con capacidades avanzadas de procesamiento, puede liberar espacio en su memoria RAM como búfer global, lo que mejora considerablemente su capacidad. Para una sola unidad de adquisición, se puede proporcionar al menos GB de capacidad como espacio de caché. Esta tecnología hace que la capacidad de búfer de nuestra unidad de adquisición de tráfico sea cientos de veces mayor que la de las unidades tradicionales. Con la misma tasa de reenvío, la duración máxima de las microrráfagas de nuestra unidad de adquisición de tráfico se incrementa. El nivel de milisegundos que soportan los equipos de adquisición tradicionales se ha actualizado al nivel de milisegundos, y el tiempo de microrráfaga que pueden soportar se ha multiplicado por miles.
Capacidad de modelado de tráfico en múltiples colas
Tecnología de procesamiento de microráfagas: una solución basada en almacenamiento en caché de gran capacidad + modelado de tráfico.
Gracias a su gran capacidad de búfer, los datos de tráfico generados por las microráfagas se almacenan en caché, y se utiliza tecnología de modelado de tráfico en la interfaz de salida para lograr una transmisión fluida de paquetes a la herramienta de análisis. Mediante la aplicación de esta tecnología, se resuelve de forma fundamental el problema de la pérdida de paquetes causada por las microráfagas.
Fecha de publicación: 27 de febrero de 2024





