La synergie inédite entre Meta, Oracle, et NVIDIA révolutionne le paysage des centres de données dédiés à l’IA. L’adoption de *Spectrum-X*, un commutateur Ethernet d’avant-garde, répond à l’essor vertigineux des systèmes d’intelligence artificielle. Chaque entreprise aspire à transformer ses infrastructures en véritables *“usines d’IA à échelle gigantesque.”* L’efficacité de l’entraînement des modèles et la vitesse de déploiement au sein des clusters massifs deviennent des enjeux décisifs pour ces géants technologiques.
Meta et Oracle adoptent NVIDIA Spectrum-X pour moderniser leurs infrastructures AI
Meta et Oracle s’engagent dans une collaboration stratégique avec NVIDIA, intégrant le système de commutation Ethernet Spectrum-X dans leurs centres de données dédiés à l’intelligence artificielle. Cette initiative vise à répondre aux exigences croissantes des systèmes d’IA à grande échelle, transformant les centres de données en véritables « usines d’IA giga-échelle ». Jensen Huang, directeur général de NVIDIA, qualifie Spectrum-X de « système nerveux » qui connecte des millions de GPU, facilitant ainsi l’entraînement des plus grands modèles d’intelligence artificielle.
Optimisation de l’efficacité de formation de l’IA
Oracle prévoit d’utiliser Spectrum-X dans son architecture Vera Rubin, permettant une interconnexion efficace de millions de GPU. Mahesh Thiagarajan, vice-président d’Oracle Cloud Infrastructure, déclare que cette configuration améliorera l’efficacité, accélérant ainsi le déploiement de nouveaux modèles d’IA. En parallèle, Meta intègre également ces commutateurs Ethernet au sein de sa plateforme interne, FBOSS, afin de gérer le réseau à grande échelle. Gaya Nagarajan, vice-présidente de l’ingénierie réseau chez Meta, souligne l’importance d’un réseau ouvert et efficace pour soutenir des modèles d’IA de plus en plus volumineux et fournir des services à des milliards d’utilisateurs.
Flexibilité et interopérabilité au cœur de la conception
La flexibilité se présente comme un élément central dans le développement des centres de données, d’après Joe DeLaere, responsable de NVIDIA pour le portefeuille des solutions de calcul accéléré. Le système MGX d’NVIDIA, avec son architecture modulaire, permet aux partenaires d’associer différentes unités de traitement, de stockage et de composants réseau selon les besoins. Cette approche favorise l’interopérabilité, offrant un cadre homogène à travers plusieurs générations de matériel.
Efficacité énergétique et défis de puissance
À mesure que les modèles d’IA croissent, l’efficacité énergétique émerge comme un défi prépondérant pour les centres de données. NVIDIA s’engage dans une démarche holistique pour améliorer l’utilisation énergétique et la scalabilité. La transition vers une alimentation électrique à courant continu de 800 volts, par exemple, limite les pertes thermiques et améliore l’efficacité. Cette nouvelle gestion de l’alimentation minimise également les pics sur le réseau électrique, réduisant les besoins maximums de puissance jusqu’à 30 % et augmentant ainsi la capacité de calcul.
Scalabilité et connexion entre centres de données
Le système MGX permet également de faciliter l’extension des centres de données, soutenant la connectivité NVLink pour le scaling vertical et Spectrum-X Ethernet pour une croissance horizontale. Gilad Shainer, vice-président senior de l’ingénierie réseau chez NVIDIA, indique que MGX peut relier plusieurs centres de données en un seul système intégré. Cela répond aux besoins des entreprises telles que Meta, qui nécessitent un soutien pour des opérations d’entraînement d’IA massivement distribuées.
Partenariats et élargissement de l’écosystème AI
NVIDIA considère Spectrum-X comme une solution pour rendre l’infrastructure d’IA plus accessible et efficace à différentes échelles. Ce système Ethernet, conçu spécifiquement pour les cargas de travail d’IA comme l’entraînement et l’inférence, offre jusqu’à 95 % de bande passante efficace. Cette technologie surpasse largement l’Ethernet traditionnel. Grâce aux collaborations avec des entreprises telles que Cisco, Meta et Oracle Cloud Infrastructure, Spectrum-X parvient à s’étendre à une variété d’environnements, allant des hyperscalers aux entreprises.
Pérennité et préparation pour l’avenir
La prochaine architecture Vera Rubin de NVIDIA devrait être disponible commercialement dans la seconde moitié de 2026. Les produits associés, tels que le modèle Rubin CPX, travailleront en tandem avec Spectrum-X et MGX pour soutenir la prochaine génération d’usines d’IA. Les technologies Spectrum-X et XGS partagent une architecture matérielle similaire, mais appliquent des algorithmes différents pour des distances variées, optimisant ainsi les communications entre centres de données.
Collaboration sur la transition énergétique
NVIDIA coopère avec divers partenaires, allant des composants de puce jusqu’à l’alimentation électrique, pour soutenir la transition vers le courant continu à 800 volts. Cette approche collaborative comprend des partenaires tels qu’Onsemi, Infineon, Delta et Schneider Electric, assurant une harmonisation fluide entre tous les systèmes dans des environnements d’IA à haute densité.
Performance pour les hyperscalers
La technologie Spectrum-X a été conçue spécifiquement pour le calcul distribué et les charges de travail d’IA. Elle intègre un routage adaptatif ainsi qu’un contrôle des congestions basé sur la télémétrie, supprimant les points chauds du réseau et garantissant une performance stable. Ces attributs permettent d’accroître les vitesses d’entraînement et d’inférence. La scalabilité que propose Spectrum-X permet aux organisations d’optimiser leurs investissements GPU tout en répondant aux demandes croissantes liées à l’entraînement de l’IA, ce qui est vital pour des entreprises comme Meta.
Synergie matériel et logiciel
NVIDIA met un accent particulier sur l’optimisation du logiciel et considère cette approche comme essentielle. L’entreprise continue d’améliorer l’efficacité en alignant le développement matériel avec le développement logiciel. Des investissements dans des cadres tels que Dynamo, TensorRT-LLM et des algorithmes comme le décodage spéculatif visent à améliorer le rendement et les performances des modèles d’IA.
IA et infrastructures évolutives
La plateforme Spectrum-X, englobant des commutateurs Ethernet et des SuperNICs, constitue le premier système Ethernet spécifiquement conçu pour les charges de travail d’IA. Elle garantit une connexion efficace entre des millions de GPU tout en maintenant une performance prévisible à travers les centres de données d’IA. Grâce à des technologies de contrôle de congestion atteignant jusqu’à 95 % de débit de données, Spectrum-X marque une avancée significative par rapport à l’Ethernet classique.
Pour en savoir plus sur des thèmes connexes, notamment les investissements en intelligence artificielle et le développement des infrastructures, consultez ces articles : Les enjeux de l’investissement chinois, Les guerres de la sécurité de l’IA, Partenariats avec le gouvernement et les entreprises, Partenariat entre OpenAI et Oracle, et La Corée du Sud et son nouveau centre de données.
Foire aux questions courantes sur l’association de Meta, Oracle et NVIDIA Spectrum-X pour les centres de données IA
Qu’est-ce que Spectrum-X et comment améliore-t-il les performances des centres de données dédiés à l’IA ?
Spectrum-X est une technologie de commutation Ethernet développée par NVIDIA, conçue pour répondre aux exigences croissantes des systèmes d’IA à grande échelle. Elle améliore l’efficacité de la formation de l’IA en offrant une connectivité rapide et un contrôle de congestion, permettant aux centres de données de traiter des modèles de paramètres massifs sans ralentissements.
Comment Oracle intègre-t-il Spectrum-X dans son architecture Vera Rubin ?
Oracle utilise Spectrum-X Ethernet pour construire des usines d’IA à grande échelle. Cette intégration permettra de connecter des millions de GPU de manière plus efficace, facilitant ainsi la formation et le déploiement rapide de nouveaux modèles d’IA pour ses clients.
Quelle est l’importance de l’ouverture et de l’interopérabilité des systèmes dans l’infrastructure IA de Meta ?
Meta, en intégrant Spectrum-X dans son système de commutation ouvert (FBOSS), s’assure que son réseau est flexible et interopérable. Cela permet au réseau de s’adapter à l’évolution des besoins en IA et de fournir des services à des milliards d’utilisateurs de manière efficace.
Quels avantages offrent les systèmes modulaires de NVIDIA, tels que le système MGX, aux partenaires technologiques ?
Le système MGX est modulaire, permettant aux partenaires de mixer et d’associer différentes unités de traitement, de stockage et de commutation selon leurs besoins. Cette flexibilité aide à optimiser le temps de mise sur le marché et à garantir que les infrastructures sont prêtes pour l’avenir.
Comment NVIDIA s’attaque-t-il aux défis d’efficacité énergétique dans les centres de données ?
NVIDIA travaille sur l’amélioration de l’efficacité énergétique en passant à une alimentation DC à 800 volts et en intégrant des technologies de lissage de l’alimentation pour réduire les pics de demande électrique. Cela contribue à optimiser la performance par watt dans les centres de données, tout en permettant une plus grande capacité de calcul.
Pourquoi la collaboration entre NVIDIA, Meta et Oracle est-elle cruciale pour le futur des centres de données IA ?
Cette collaboration vise à rendre l’infrastructure IA plus efficace et accessible à différentes échelles. En unissant leurs forces, ces entreprises peuvent développer des solutions conçues spécifiquement pour les charges de travail IA, ce qui optimise les performances et réduit les coûts opérationnels.
Quels sont les avantages de Spectrum-X par rapport à l’Ethernet traditionnel pour les workloads IA ?
Spectrum-X offre jusqu’à 95 % de bande passante effective, surpassant largement les performances de l’Ethernet traditionnel, qui atteint généralement seulement environ 60 %. Cela est particulièrement crucial pour les tâches de formation et d’inférence en IA, où chaque milliseconde compte.
Comment NVIDIA prévoit-il d’intégrer Spectrum-X avec sa future architecture Vera Rubin ?
NVIDIA prévoit que l’architecture Vera Rubin, qui sera commercialement disponible en 2026, fonctionnera en tandem avec les systèmes Ethernet Spectrum-X et MGX, permettant le soutien à la prochaine génération d’usines d’IA et améliorant la connectivité entre les centres de données.