Die bislang einzigartige Synergie zwischen Meta, Oracle und NVIDIA revolutioniert die Landschaft der IA-Datenzentren. Die Einführung von *Spectrum-X*, einem hochmodernen Ethernet-Switch, reagiert auf den rasanten Anstieg der Systeme der künstlichen Intelligenz. Jedes Unternehmen strebt danach, seine Infrastrukturen in wahre *“IA-Fabriken von gigantischen Dimensionen.”* zu transformieren. Die Effizienz des Modeltrainings und die Geschwindigkeit der Bereitstellung in massiven Clustern werden zu entscheidenden Herausforderungen für diese Technologiegiganten.
Meta und Oracle nutzen NVIDIA Spectrum-X zur Modernisierung ihrer AI-Infrastrukturen
Meta und Oracle engagieren sich in einer strategischen Zusammenarbeit mit NVIDIA und integrieren das Ethernet-Switch-System Spectrum-X in ihren Datenzentren, die der künstlichen Intelligenz gewidmet sind. Diese Initiative zielt darauf ab, den wachsenden Anforderungen an groß angelegte IA-Systeme gerecht zu werden und die Datenzentren in wahre “Giga-Skalierung IA-Fabriken” zu verwandeln. Jensen Huang, Geschäftsführer von NVIDIA, bezeichnet Spectrum-X als „Nervensystem“, das Millionen von GPUs verbindet und so das Training der größten Modelle der künstlichen Intelligenz erleichtert.
Optimierung der Effizienz im IA-Training
Oracle plant, Spectrum-X in seiner Vera Rubin-Architektur zu nutzen, um eine effiziente Interkonnektivität von Millionen von GPUs zu ermöglichen. Mahesh Thiagarajan, Vizepräsident von Oracle Cloud Infrastructure, erklärt, dass diese Konfiguration die Effizienz verbessern und so die Bereitstellung neuer IA-Modelle beschleunigen wird. Parallel dazu integriert auch Meta diese Ethernet-Switches in seine interne Plattform FBOSS, um das Netzwerk in großem Maßstab zu verwalten. Gaya Nagarajan, Vizepräsidentin für Netzwerkengineering bei Meta, betont die Bedeutung eines offenen und effizienten Netzwerks zur Unterstützung zunehmend umfangreicher IA-Modelle und zur Bereitstellung von Dienstleistungen für Milliarden von Benutzern.
Flexibilität und Interoperabilität im Mittelpunkt des Designs
Flexibilität stellt sich als zentrales Element in der Entwicklung der Datenzentren dar, so Joe DeLaere, verantwortlich bei NVIDIA für das Portfolio der beschleunigten Rechenlösungen. Das MGX-System von NVIDIA mit seiner modularen Architektur ermöglicht es Partnern, verschiedene Verarbeitungs-, Speicher- und Netzwerkkomponenten je nach Bedarf zu kombinieren. Dieser Ansatz fördert die Interoperabilität und bietet einen einheitlichen Rahmen über mehrere Generationen von Hardware.
Energieeffizienz und Herausforderungen der Leistung
Mit dem Wachstum der IA-Modelle tritt die Energieeffizienz als eine herausragende Herausforderung für die Datenzentren auf. NVIDIA engagiert sich in einem holistischen Ansatz zur Verbesserung der Energieeffizienz und Skalierbarkeit. Der Wechsel zu einer Stromversorgung mit 800 Volt Gleichstrom begrenzt zum Beispiel die Wärmeverluste und verbessert die Effizienz. Diese neue Energiebewirtschaftung minimiert auch die Spitzenlasten im Stromnetz und senkt die maximalen Leistungsanforderungen um bis zu 30 % und erhöht so die Rechenkapazität.
Skalierbarkeit und Verbindung zwischen Datenzentren
Das MGX-System ermöglicht auch die Erweiterung der Datenzentren und unterstützt die NVLink-Konnektivität für vertikales Scaling und Spectrum-X Ethernet für horizontales Wachstum. Gilad Shainer, Senior Vice President für Netzwerkengineering bei NVIDIA, erklärt, dass MGX mehrere Datenzentren in einem einzigen integrierten System verbinden kann. Dies entspricht den Anforderungen von Unternehmen wie Meta, die eine Unterstützung für massiv verteilte IA-Training-Operationen benötigen.
Partnerschaften und Erweiterung des IA-Ökosystems
NVIDIA betrachtet Spectrum-X als eine Lösung, um die IA-Infrastruktur für unterschiedliche Skalierungen zugänglicher und effizienter zu machen. Dieses Ethernet-System, das speziell für IA-Workloads wie Training und Inferenz entwickelt wurde, bietet bis zu 95 % effektive Bandbreite. Diese Technologie übertrifft bei weitem traditionelles Ethernet. Durch die Zusammenarbeit mit Unternehmen wie Cisco, Meta und Oracle Cloud Infrastructure kann Spectrum-X in einer Vielzahl von Umgebungen, von Hyperscalern bis hin zu Unternehmen, erweitert werden.
Nachhaltigkeit und Vorbereitung auf die Zukunft
Die nächste Vera Rubin-Architektur von NVIDIA wird voraussichtlich in der zweiten Hälfte des Jahres 2026 kommerziell verfügbar sein. Die dazugehörigen Produkte, wie das Modell Rubin CPX, werden in Kombination mit Spectrum-X und MGX arbeiten, um die nächste Generation von IA-Fabriken zu unterstützen. Die Technologien von Spectrum-X und XGS teilen sich eine ähnliche Hardware-Architektur, wenden jedoch unterschiedliche Algorithmen für verschiedene Distanzen an, um die Kommunikation zwischen den Datenzentren zu optimieren.
Zusammenarbeit bei der Energieumstellung
NVIDIA arbeitet mit verschiedenen Partnern zusammen, von Chipkomponenten bis zur Stromversorgung, um die Umstellung auf 800 Volt Gleichstrom zu unterstützen. Dieser kollaborative Ansatz umfasst Partner wie Onsemi, Infineon, Delta und Schneider Electric und sorgt für eine nahtlose Harmonisierung zwischen allen Systemen in hochverdichteten IA-Umgebungen.
Leistung für Hyperscaler
Die Technologie Spectrum-X wurde speziell für verteiltes Rechnen und IA-Workloads entwickelt. Sie integriert adaptives Routing sowie eine congestionsbasierte Kontrolle durch Telemetrie, wodurch Hotspots im Netzwerk eliminiert und eine stabile Leistung gewährleistet werden. Diese Attribute ermöglichen es, die Geschwindigkeiten für Training und Inferenz zu steigern. Die Skalierbarkeit, die Spectrum-X bietet, ermöglicht es Organisationen, ihre GPU-Investitionen zu optimieren und gleichzeitig den wachsenden Anforderungen des IA-Trainings gerecht zu werden, was für Unternehmen wie Meta entscheidend ist.
Synergie von Hardware und Software
NVIDIA legt besonderen Wert auf die Optimierung von Software und betrachtet diesen Ansatz als wesentlich. Das Unternehmen verbessert kontinuierlich die Effizienz, indem es die Hardwareentwicklung mit der Softwareentwicklung in Einklang bringt. Investitionen in Frameworks wie Dynamo, TensorRT-LLM und Algorithmen wie das spekulative Decoding zielen darauf ab, den Ertrag und die Leistung von IA-Modellen zu verbessern.
IA und skalierbare Infrastrukturen
Die Plattform Spectrum-X, die Ethernet-Switches und SuperNICs umfasst, ist das erste Ethernet-System, das speziell für IA-Workloads konzipiert wurde. Es gewährleistet eine effiziente Verbindung zwischen Millionen von GPUs und sorgt gleichzeitig für eine vorhersehbare Leistung in IA-Datenzentren. Durch Technologien zur Verkehrssteuerung, die bis zu 95 % Datenübertragungsrate erreichen, stellt Spectrum-X einen signifikanten Fortschritt im Vergleich zu herkömmlichem Ethernet dar.
Um mehr über verwandte Themen, einschließlich Investitionen in künstliche Intelligenz und den Ausbau von Infrastrukturen, zu erfahren, lesen Sie diese Artikel: Die Herausforderungen der chinesischen Investitionen, Die Kriege um die Sicherheit der IA, Partnerschaften mit Regierung und Unternehmen, Partnerschaft zwischen OpenAI und Oracle und Südkorea und sein neues Datenzentrum.
Häufig gestellte Fragen zur Zusammenarbeit zwischen Meta, Oracle und NVIDIA Spectrum-X für IA-Datenzentren
Was ist Spectrum-X und wie verbessert es die Leistung der IA-Datenzentren?
Spectrum-X ist eine von NVIDIA entwickelte Ethernet-Switch-Technologie, die auf die wachsenden Anforderungen großer IA-Systeme zugeschnitten ist. Sie verbessert die Effizienz des IA-Trainings, indem sie schnelle Konnektivität und eine Verkehrssteuerung bietet, sodass Datenzentren massiven Parameter-Modellen ohne Verzögerungen bearbeiten können.
Wie integriert Oracle Spectrum-X in seine Vera Rubin-Architektur?
Oracle nutzt Spectrum-X Ethernet, um gigantische IA-Fabriken zu schaffen. Diese Integration wird es ermöglichen, Millionen von GPUs effizienter zu verbinden, was das Training und die schnelle Bereitstellung neuer IA-Modelle für ihre Kunden erleichtert.
Welche Bedeutung hat die Offenheit und Interoperabilität der Systeme in der IA-Infrastruktur von Meta?
Meta, indem es Spectrum-X in sein offenes Switching-System (FBOSS) integriert, stellt sicher, dass sein Netzwerk flexibel und interoperabel ist. Dies ermöglicht es dem Netzwerk, sich an die sich entwickelnden IA-Anforderungen anzupassen und effizient Dienstleistungen für Milliarden von Benutzern bereitzustellen.
Welche Vorteile bieten die modularen Systeme von NVIDIA, wie das MGX-System, den Technologiepartnern?
Das MGX-System ist modular und ermöglicht es Partnern, verschiedene Verarbeitungs-, Speicher- und Switching-Einheiten je nach Bedarf zu kombinieren. Diese Flexibilität hilft, die Markteinführungszeit zu optimieren und sicherzustellen, dass die Infrastrukturen zukunftsfähig sind.
Wie geht NVIDIA die Herausforderungen der Energieeffizienz in Datenzentren an?
NVIDIA arbeitet an der Verbesserung der Energieeffizienz durch den Wechsel zu 800 Volt Gleichstrom und die Integration von Energiemanagementtechnologien zur Reduzierung von Spitzenlasten. Dies hilft, die Leistung pro Watt in Datenzentren zu optimieren und gleichzeitig eine größere Rechenkapazität zu ermöglichen.
Warum ist die Zusammenarbeit zwischen NVIDIA, Meta und Oracle entscheidend für die Zukunft der IA-Datenzentren?
Diese Zusammenarbeit zielt darauf ab, die IA-Infrastruktur effizienter und zugänglicher für unterschiedliche Maßstäbe zu gestalten. Durch die Bündelung ihrer Kräfte können diese Unternehmen Lösungen entwickeln, die speziell für IA-Workloads konzipiert sind, was die Leistung optimiert und die Betriebskosten senkt.
Welche Vorteile bietet Spectrum-X im Vergleich zu traditionellem Ethernet für IA-Workloads?
Spectrum-X bietet bis zu 95 % effektive Bandbreite, was die Leistung des traditionellen Ethernets, das normalerweise nur etwa 60 % erreicht, bei weitem übertrifft. Dies ist besonders entscheidend für Trainings- und Inferenzaufgaben in der IA, bei denen jede Millisekunde zählt.
Wie plant NVIDIA die Integration von Spectrum-X mit seiner zukünftigen Vera Rubin-Architektur?
NVIDIA plant, dass die Vera Rubin-Architektur, die 2026 kommerziell verfügbar sein wird, in Kombination mit den Ethernet-Systemen Spectrum-X und MGX funktionieren wird, um die nächste Generation von IA-Fabriken zu unterstützen und die Konnektivität zwischen den Datenzentren zu verbessern.