8. Juli 2024

Anpassen der Datenverbindungen von Rechenzentren an die Flut an KI-Daten

KI

Künstliche Intelligenz (KI) verändert zweifellos die Welt, von Ausbildung Und Gesundheitspflege Zu Finanzen und Außenpolitik. Da Unternehmen und Rechenzentrumsanbieter weiterhin speziell entwickelte Rechenzentrumsinfrastrukturplattformen (wie den NVIDIA DGX SuperPOD) einsetzen, die den Einsatz von KI im großen Maßstab ermöglichen, steigt der Druck auf die Ingenieure für optische Rechenzentrumsnetzwerke. Infolgedessen steht die optische Transceiver-Technologie wieder einmal mehr im Rampenlicht als je zuvor. Hier erfahren Sie, wie.

Die Flut an KI-Daten stellt DCI- und Intra-Data-Center-Architekturen vor Herausforderungen

In zahlreichen Branchen übernehmen Unternehmen zunehmend datenintensive KI-Workloads mit einigen der größten generativen KI-Anwendungen basierend auf Billionen von Parametern. Von der Modellierung großer Sprachen und KI-Training bis hin zu High Performance Computing (HPC)-Simulationen erzeugen diese Workloads riesige Datenmengen, die sowohl innerhalb als auch zwischen den heutigen Rechenzentren verarbeitet, analysiert und weitergeleitet werden müssen. Infolgedessen stehen die Netzwerkingenieure von Rechenzentren unter enormem Druck, sowohl ihre DCI-Architekturen (Data Center Interconnect) als auch ihre Netzwerke innerhalb der Rechenzentren zu optimieren, um den steigenden Anforderungen KI-gesteuerter Anwendungen heute gerecht zu werden und gleichzeitig für die Zukunft zu planen.

In einem aktuellen Artikel von Data Center FrontierSameh Boujelbene, VP bei der Dell'Oro Group, sagte, dass das rasante Wachstum der Anzahl der Parameter, die von generativen KI-Anwendungen verarbeitet werden, sich jährlich verzehnfacht. Da Unternehmen, Hyperscale-Rechenzentren und sogar Colocation-Anbieter damit beginnen, Tausende oder sogar „Hunderttausende beschleunigter Knoten“ einzusetzen, werden Rechenzentrumsnetzwerke laut Boujelbene kaum noch mit der anhaltenden Datenflut Schritt halten können. Als Beispiel stellt Peter Jones, Vorsitzender der Ethernet Alliance, fest, dass die Grenzen der Hyperscale-Rechenzentrumsnetzwerke „die Terabit-pro-Sekunde-Schwelle überschreiten“. Kürzlich Omdia-Forschung stellt fest, dass der Einsatz von KI die Einführung optischer Technologien in Rechenzentren aller Größen erheblich steigern wird, wobei niedrigere Datenraten wie 100G und 200G zurückgehen und höhere Raten wie 400G, 800G und 1,6T zunehmen werden.

Was bedeutet dies für DCI und die Netzwerkstrukturen in den heutigen Rechenzentren? Die Antwort liegt in der Einführung höherer Datenraten wie 800G und sogar 1,2T und 1,6T. Aus Sicht der Konnektivität innerhalb des Rechenzentrums bedeutet dies auch einen verstärkten Fokus auf das Transceiver-Design, um die Skalierbarkeit zu verbessern, die Latenz zu reduzieren und die Energieeffizienz zu steigern und so den hohen Geschwindigkeits-, Latenz- und datenintensiven Anforderungen von KI-Anwendungen gerecht zu werden.

Das moderne Gesicht der DCI- und Intra-Datacenter-Konnektivität: 800G und neue, energieeffiziente Schnittstellen

Da 400G-Transceiver-Varianten bereits gut auf dem Markt etabliert sind, beginnen die Betreiber von Rechenzentren bereits damit, 800G-Technologien einzusetzen, um die enormen Datenmengen zu bewältigen, die KI und andere HPC-Anwendungen generieren werden. Das OFC hat in seiner Nachbericht 2024, weist darauf hin, dass die Installationen der 800G-Variante im Jahr 2024 und danach beschleunigt werden, „um KI-Backend-Netzwerke sowie das allgemeine Ethernet-Netzwerk zu unterstützen, das alle Rechenzentrums-Workloads unterstützt.“

Wenn es um interoperable, kohärente 800G-Standards geht, ist die Arbeit der OIF an 800ZR und 800LR sticht hervor. Der OIF 800ZR-Standard ist eine Spezifikation für 800G Ethernet über eine einzige Wellenlänge unter Verwendung kohärenter Optik. Er ist für DCI-Anwendungen vorgesehen und kann verwendet werden, um Rechenzentren über Entfernungen von bis zu 80 km zu verbinden. Der 800LR-Standard konzentriert sich auf die 800G Ethernet-Übertragung über eine einzige Wellenlänge für Entfernungen von bis zu 10 km. Damit eignet er sich für Campus- oder Intra-DC-Anwendungen, die wie Dell'Oro bemerkt, wird eine wichtige Grenze bei der Entwicklung von Rechenzentrumsnetzwerken sein, da die wachsenden Bandbreitenanforderungen der KI „den Bedarf an optischen 800G-Transceivern in Rechenzentren vorantreiben.“

Aus der Perspektive eines Rechenzentrums sind sowohl Linear Pluggable Optics (LPO) als auch Co-Packaged Optics (CPO) ernsthafte Konkurrenten bei der Revolutionierung der typischen Leistungs- und Latenzgleichung für Rechenzentren. Die Linearantriebstechnologie, die LPO-Links nutzen, macht die komplexe digitale Signalverarbeitung (DSP) auf der Optik überflüssig, indem sie sich für die digitale Formatierung auf den SERDES DSP im Switch-Chip verlässt. Der DSP auf dem Switch-ASIC treibt eine optische Engine auf der steckbaren Optik an, die nur lineare Verstärker enthält. Infolgedessen ist der Stromverbrauch von LPO viel geringer als der von herkömmlichen steckbaren Varianten, was es zu einer attraktiven Wahl macht, da Rechenzentrumsbetreiber als Reaktion auf die Anforderungen der KI mehr Transceiver in ihren Netzwerken einsetzen.

Die CPO-Technologie bietet auch erhebliche Vorteile in Bezug auf Stromverbrauch und Latenz. Im Gegensatz zum LPO-Design integriert die CPO-Optik optische Engines direkt mit Switch-ASICs – alles im selben Paket. Auf diese Weise ermöglichen CPOs eine kurze, verlustarme Kommunikation zwischen dem Chip und der optischen Engine, sodass Netzwerkbetreiber die Anzahl der von ihnen verwendeten DSPs reduzieren und so den Stromverbrauch senken können. Schließlich kann der DSP die Gesamtsystemleistung um bis zu so viel wie 25-30%. CPOs ermöglichen außerdem eine Kommunikation mit geringer Latenz, da lange Kupferleitungen zwischen dem ASIC und der Optik entfallen und weniger DSPs verwendet werden können.   

Allerdings sind sowohl LPOs als auch CPOs noch in der frühe Phasen der Entwicklung und Demonstration. Beispielsweise gibt es bei LPOs immer noch viele Bedenken hinsichtlich der Switch-Chip-Unterstützung, des Systemdesigns und der Interoperabilität. ein LPO MSA wurde etabliert, was ein gewisses Maß an Zuversicht bietet, dass solche Probleme in nicht allzu ferner Zukunft behoben werden. Sowohl für LPO als auch für CPO besteht das Konzept darin, neue Lösungen zu finden, die die Optik effizienter machen, indem sie Stromverbrauch, Latenz und Kosten senken.

Da KI-Anwendungen immer vielfältigere und komplexere Datenströme erzeugen, benötigen Rechenzentrumsbetreiber optische Lösungen, die diese Datennutzlasten aufnehmen und effizient über ihre Netzwerke transportieren können. In unserem Whitepaper mit dem Titel Leitfaden für Netzwerkbetreiber: Die neuesten Fortschritte bei 400G und 800G, Wir diskutieren die Chancen und Herausforderungen rund um die Einführung von 800G in modernen Netzwerken, einschließlich DCI. Die Innovationen rund um jede Technologie fügen den ohnehin komplexen Anforderungen an die Anpassung eines Rechenzentrums zur Nutzung einer speziell entwickelten KI-Recheninfrastruktur eine Vielzahl von Überlegungen zur Systemintegration hinzu. Daher wird es für die Netzwerkingenieure von Rechenzentren immer notwendiger, 800G-Transceiver einzusetzen, um ihre Infrastruktur zukunftssicher zu machen und Skalierbarkeit angesichts steigender Datenanforderungen sicherzustellen.

Die Anpassung an KI im Rechenzentrum erfordert fundiertes Fachwissen und Partnerschaften

Egal, ob Sie bei der Einführung von 400G vor Herausforderungen stehen oder die Bereitstellung von 800G-Optik planen, es gibt viel zu beachten. Leistungsanforderungen der Transceiver, Beliebtheit der Formfaktoren, Interoperabilität mehrerer Anbieter und Netzwerkorchestrierung sind nur einige der Probleme, mit denen zukunftsorientierte Rechenzentrumsbetreiber konfrontiert werden, wenn sie versuchen, ihre Netzwerke an die Anforderungen von KI-Workloads anzupassen. Und hier können wir helfen. Unser Team aus erfahrenen Ingenieuren verfügt über tiefgreifende Fachkenntnisse in allen Aspekten der Systemintegration, Netzwerkarchitekturen und der darin enthaltenen optischen Transceiver. Mit robusten Tests und unserem beratenden Ansatz haben wir eine nachgewiesene Erfolgsbilanz bei der Umsetzung der Visionen unserer Kunden in die Realität. Kontaktieren Sie uns noch heute mit Ihren Fragen!