Im typischen NPB-Anwendungsszenario stellt der Paketverlust aufgrund der Überlastung gespiegelter Pakete und NPB-Netzwerke das größte Problem für Administratoren dar. Paketverluste in NPB können in Backend-Analysetools typischerweise folgende Symptome hervorrufen:
- Ein Alarm wird ausgelöst, wenn der Leistungsindikator des APM-Dienstes sinkt und die Transaktionserfolgsrate abnimmt.
- Es wird ein Ausnahmealarm für den NPM-Netzwerkleistungsüberwachungsindikator generiert.
Das Sicherheitsüberwachungssystem erkennt Netzwerkangriffe aufgrund fehlender Ereignisse nicht.
- Ausfallverhaltens-Auditereignisse, die vom Service-Audit-System generiert werden
... ...
Als zentrales Erfassungs- und Verteilungssystem für die Bypass-Überwachung ist die Bedeutung von NPB offensichtlich. Gleichzeitig unterscheidet sich die Verarbeitung des Datenpaketverkehrs deutlich von der herkömmlicher Netzwerk-Switches, und die in vielen Dienstnetzen eingesetzten Technologien zur Staukontrolle sind auf NPB nicht anwendbar. Um Paketverluste in NPB zu beheben, beginnen wir mit der Ursachenanalyse.
NPB/TAP-Paketverlust-Überlastungsanalyse – Ursachenanalyse
Zunächst analysieren wir den tatsächlichen Datenverkehrspfad und die Zuordnungsbeziehung zwischen dem System und den Ein- und Ausgängen des Level-1- oder Level-NPB-Netzwerks. Unabhängig von der Netzwerktopologie des NPB-Systems besteht als Sammelsystem eine Viele-zu-Viele-Beziehung zwischen den „Zugriffs-“ und „Ausgangs“-Eingängen des Gesamtsystems.
Anschließend betrachten wir das Geschäftsmodell von NPB aus der Perspektive von ASIC-Chips auf einem einzelnen Gerät:
Merkmal 1Die Datenverkehrsrate und die physikalische Datenrate der Eingangs- und Ausgangsschnittstellen sind asymmetrisch, was zwangsläufig zu einer großen Anzahl von Mikro-Bursts führt. In typischen Szenarien der Aggregation von Datenverkehr (Viele-zu-Eins oder Viele-zu-Viele) ist die physikalische Datenrate der Ausgangsschnittstelle üblicherweise geringer als die gesamte physikalische Datenrate der Eingangsschnittstelle. Beispiel: 10 Kanäle mit 10G-Datenerfassung und 1 Kanal mit 10G-Datenausgabe. In einem mehrstufigen Bereitstellungsszenario können alle NPBBS als Einheit betrachtet werden.
Feature 2Die Cache-Ressourcen von ASIC-Chips sind sehr begrenzt. Gängige ASIC-Chips mit einer Austauschkapazität von 640 Gbit/s verfügen über einen Cache von 3–10 MByte, während ein Chip mit 3,2 Tbit/s Kapazität nur 20–50 MByte besitzt. Dies gilt unter anderem für Hersteller wie Broadcom, Barefoot, CTC und Marvell.
Feature 3Der herkömmliche End-to-End-PFC-Flusskontrollmechanismus ist für NPB-Dienste nicht anwendbar. Kern des PFC-Flusskontrollmechanismus ist die Erzielung einer End-to-End-Verkehrsunterdrückung durch Feedback, um letztendlich die Anzahl der an den Protokollstapel des Kommunikationsendpunkts gesendeten Pakete zu reduzieren und so Überlastungen zu verringern. Da die Paketquelle von NPB-Diensten jedoch gespiegelte Pakete sind, kann die Strategie zur Überlastungsbehandlung lediglich das Verwerfen oder Zwischenspeichern von Paketen umfassen.
Nachfolgend ist das typische Erscheinungsbild eines Mikrobursts in der Strömungskurve dargestellt:
Am Beispiel einer 10G-Schnittstelle lässt sich zeigen, dass die Datenrate im Diagramm der Verkehrstrendanalyse zweiter Ebene über einen längeren Zeitraum bei etwa 3 Gbit/s liegt. Im Diagramm der Mikromillisekunden-Trendanalyse hingegen übersteigt der Datenverkehrsspitzenwert (MicroBurst) die physikalische Datenrate der 10G-Schnittstelle deutlich.
Wichtige Techniken zur Minderung von NPB-Mikrobursts
Die Auswirkungen asymmetrischer physikalischer Schnittstellenratenabweichungen verringernBei der Netzwerkplanung sollten asymmetrische Datenraten an den physikalischen Schnittstellen für Ein- und Ausgänge so weit wie möglich reduziert werden. Eine gängige Methode ist die Verwendung einer Uplink-Schnittstelle mit höherer Datenrate und die Vermeidung asymmetrischer Datenraten an den physikalischen Schnittstellen (z. B. die gleichzeitige Übertragung von 1-Gbit/s- und 10-Gbit/s-Datenverkehr).
Optimieren Sie die Cache-Verwaltungsrichtlinie des NPB-DienstesDie für den Switching-Dienst geltende allgemeine Cache-Verwaltungsrichtlinie ist für den Weiterleitungsdienst des NPB-Dienstes nicht anwendbar. Basierend auf den Eigenschaften des NPB-Dienstes sollte eine Cache-Verwaltungsrichtlinie mit statischer Garantie und dynamischer Freigabe implementiert werden, um die Auswirkungen von NPB-Mikroausbrüchen unter den aktuellen Hardwarebeschränkungen des Chips zu minimieren.
Implementierung des klassifizierten Verkehrsmanagement- Implementieren Sie ein priorisiertes Traffic-Engineering-Service-Klassifizierungsmanagement basierend auf der Verkehrsklassifizierung. Stellen Sie die Dienstqualität verschiedener Prioritätswarteschlangen basierend auf den Bandbreiten der Kategorienwarteschlangen sicher und gewährleisten Sie, dass benutzerkritische Dienstdatenpakete ohne Paketverlust weitergeleitet werden können.
Eine vernünftige Systemlösung verbessert die Paketzwischenspeicherung und die Verkehrsformung.Die Lösung integriert die Daten mithilfe verschiedener technischer Mittel, um die Paket-Caching-Kapazität des ASIC-Chips zu erweitern. Durch die Formung des Datenflusses an unterschiedlichen Stellen wird der Mikro-Burst nach der Formung zu einer mikro-gleichmäßigen Flusskurve.
Mylinking™ Micro Burst Traffic Management Solution
Schema 1 – Netzwerkoptimierte Cache-Verwaltungsstrategie + netzwerkweites, klassifiziertes Prioritätenmanagement der Dienstqualität
Cache-Verwaltungsstrategie für das gesamte Netzwerk optimiert
Basierend auf dem tiefen Verständnis der NPB-Diensteigenschaften und der praktischen Geschäftsszenarien zahlreicher Kunden implementieren die Datenverkehrserfassungsprodukte von Mylinking™ eine NPB-Cache-Management-Strategie aus „statischer Absicherung + dynamischer Aufteilung“ für das gesamte Netzwerk. Diese Strategie erzielt eine hohe Effektivität im Datenverkehrs-Cache-Management, insbesondere bei einer großen Anzahl asymmetrischer Eingangs- und Ausgangsschnittstellen. Die Toleranz gegenüber Mikrospitzen wird bei festem ASIC-Chip-Cache maximal erreicht.
Mikroburst-Verarbeitungstechnologie – Management basierend auf Geschäftsprioritäten
Wird die Einheit zur Datenverkehrserfassung eigenständig eingesetzt, kann sie nach der Wichtigkeit des Backend-Analysetools oder der Servicedaten selbst priorisiert werden. Beispielsweise hat APM/BPC unter den vielen Analysetools eine höhere Priorität als Sicherheitsanalyse-/Sicherheitsüberwachungstools, da es die Überwachung und Analyse verschiedener Indikatordaten wichtiger Geschäftssysteme umfasst. Daher können in diesem Szenario die von APM/BPC benötigten Daten als hochprioritär, die von Sicherheitsüberwachungs-/Sicherheitsanalysetools benötigten Daten als mittelprioritär und die von anderen Analysetools benötigten Daten als niedrigprioritär eingestuft werden. Beim Eintreffen der erfassten Datenpakete am Eingangsport werden die Prioritäten entsprechend ihrer Wichtigkeit festgelegt. Pakete mit höherer Priorität werden bevorzugt weitergeleitet, nachdem die Pakete mit höherer Priorität weitergeleitet wurden, und Pakete mit anderen Prioritäten werden weitergeleitet, nachdem die Pakete mit höherer Priorität weitergeleitet wurden. Treffen weiterhin Pakete mit höherer Priorität ein, werden diese bevorzugt weitergeleitet. Übersteigt die Eingangsdatenmenge die Weiterleitungskapazität des Ausgangsports über einen längeren Zeitraum, werden die überschüssigen Daten im Cache des Geräts gespeichert. Ist der Cache voll, verwirft das Gerät vorrangig Pakete mit niedrigerer Priorität. Dieser priorisierte Verwaltungsmechanismus stellt sicher, dass wichtige Analysetools die für die Analyse benötigten Originaldaten des Datenverkehrs effizient und in Echtzeit abrufen können.
Mikroburst-Verarbeitungstechnologie – Klassifizierungsgarantiemechanismus für die gesamte Netzwerkdienstqualität
Wie in der obigen Abbildung dargestellt, wird die Verkehrsklassifizierungstechnologie eingesetzt, um verschiedene Dienste auf allen Geräten der Zugriffs-, Aggregations-/Kern- und Ausgabeschicht zu unterscheiden und die Prioritäten der erfassten Pakete neu zu kennzeichnen. Der SDN-Controller stellt die Verkehrspriorisierungsrichtlinie zentral bereit und wendet sie auf die Weiterleitungsgeräte an. Alle am Netzwerk beteiligten Geräte werden entsprechend der Priorität der Pakete verschiedenen Prioritätswarteschlangen zugeordnet. Dadurch wird bei geringem Datenverkehr mit erhöhter Priorität ein Paketverlust von null erreicht. Das Problem des Paketverlusts bei APM-Überwachung und Bypass-Verkehr für spezielle Dienste wird effektiv gelöst.
Lösung 2 – GB-basierter Systemcache mit Traffic Shaping
GB-Level-System erweiterter Cache
Verfügt unser Verkehrserfassungsgerät über fortschrittliche Verarbeitungsfunktionen, kann es einen bestimmten Speicherplatz im Arbeitsspeicher (RAM) als globalen Puffer freigeben und so die Pufferkapazität erheblich steigern. Ein einzelnes Erfassungsgerät kann mindestens ein Gigabyte Speicherplatz als Cache bereitstellen. Dank dieser Technologie ist die Pufferkapazität unseres Verkehrserfassungsgeräts um ein Vielfaches höher als die herkömmlicher Geräte. Bei gleicher Weiterleitungsrate verlängert sich die maximale Dauer von Mikrobursts. Die von herkömmlichen Erfassungsgeräten unterstützte Millisekunden-Ebene wurde auf Sekunden erhöht, und die verkraftbare Mikroburst-Dauer hat sich um ein Vielfaches verlängert.
Fähigkeit zur Steuerung des Datenverkehrs über mehrere Warteschlangen
Microburst-Verarbeitungstechnologie – eine Lösung basierend auf großem Puffer-Caching + Traffic Shaping
Dank einer extrem großen Pufferkapazität werden die durch Mikro-Ausbrüche erzeugten Verkehrsdaten zwischengespeichert, und die Traffic-Shaping-Technologie sorgt in der ausgehenden Schnittstelle für eine reibungslose Paketausgabe an das Analysetool. Durch den Einsatz dieser Technologie wird das durch Mikro-Ausbrüche verursachte Paketverlustphänomen grundlegend behoben.
Veröffentlichungsdatum: 27. Februar 2024





