Gemma 3n : Google réduit la taille de l’intelligence artificielle de pointe

Publié le 24 mai 2025 à 09h10
modifié le 24 mai 2025 à 09h10
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

Gemma 3n redéfinit les standards de l’intelligence artificielle avec une réduction significative de taille. Google révolutionne l’inférence avec son modèle extrêmement performant adapté aux appareils. Une architecture innovante brise les barrières de la performance face à des ressources limitées. Ce SLM multimodal combine texte, audio, vidéo et image, tout en maintenant une efficacité remarquable. Les transformations engendrées par Gemma 3n pourraient redéfinir notre interaction avec la technologie, simplifiant l’accès à l’intelligence artificielle avancée.

Présentation de Gemma 3n

Google a récemment dévoilé le modèle Gemma 3n, un système de langage multimodal (SLM) innovant, lors de Google I/O 2025. Ce modèle, développé par l’équipe de DeepMind, se distingue par sa capacité à traiter des données sous diverses formes telles que le texte, l’audio, la vidéo et les images. Sa conception a été optimisée pour l’inférence sur CPU, ce qui le rend accessible sur des appareils disposant de ressources limitées.

Une architecture novatrice

La famille des modèles Gemma intègre les avancées technologiques issues de son prédécesseur, Gemini. Les ingénieurs de DeepMind ont adopté une approche radicale en développant une nouvelle architecture dédiée à l’utilisation sur des appareils moins puissants. L’innovation majeure, nommée Per-Layer, réduit significativement la consommation de RAM. Ainsi, Gemma 3n, équipé de 5 ou 8 milliards de paramètres, fonctionne avec une empreinte mémoire largement inférieure à celle de modèles similaires.

Performance et benchmarks

Sur des plateformes de référence comme la Chatbot Arena, Gemma 3n obtient un score Elo impressionnant de 1269, le plaçant juste derrière Claude 3.7 Sonnet. La performance est d’autant plus remarquable pour un modèle de cette taille. Les résultats sur des benchmarks traditionnels, comme 64,9% sur MMLU et 63,6% sur MBPP, confirment son statut de modèle d’exception.

Spécificités techniques

Le MatFormer, une autre innovation de l’architecture, permet l’intégration d’un sous-modèle de 2 milliards de paramètres. Cette fonctionnalité aide à adapter la taille des modèles en fonction de la complexité des tâches. Les développeurs peuvent ainsi recréer diverses tailles de sous-modèle, maximisant l’efficacité des ressources utilisées.

Accessibilité et utilisation

Gemma 3n est d’ores et déjà accessible via Google AI Studio sans frais, et les utilisateurs peuvent également télécharger les poids du modèle sur Hugging Face. Actuellement, la version déployée permet uniquement le traitement des modalités texte et images, mais des mises à jour sont en cours pour intégrer toutes les modalités.

Conditions d’utilisation

Utiliser ce modèle à des fins commerciales n’entraîne aucun frais de licence ni redevances pour Google. Néanmoins, certaines restrictions s’appliquent. L’utilisation de Gemma 3n est interdite pour la génération de contenus protégés ou illégaux. La prise de décisions automatisées dans des secteurs affectant les droits individuels, tels que la finance ou la santé, est également prohibée.

Applications recommandées

Gemma 3n établit une nouvelle référence dans le domaine des SLM open source. Google recommande son intégration pour la génération de texte, le résumé d’informations, l’analyse visuelle et la transcription audio. Une caractéristique notable est son optimisation pour l’inférence sur mobile, avec un besoin en RAM limité à seulement 3924 Mo, ce qui le rend idéal pour explorer de nouveaux usages, tels que mentionné dans ces projets : Reachy 2, OpenAI et l’IA en entreprise.

Conclusion sur sa supériorité

Gemma 3n juxtapose performance et modularité dans un aspect compact. Ce modèle, en phase avec les dernières avancées en intelligence artificielle, incarne une réponse précise à la demande croissante d’efficacité dans les SLM. Sa taille réduite contraste avec ses résultats impressionnants sur des benchmarks spécifiques, lui permettant de se positionner en tête de la compétition technologique.

FAQ utilisateur sur Gemma 3n : Google réduit la taille de l’intelligence artificielle de pointe

Qu’est-ce que Gemma 3n et en quoi se distingue-t-il des autres modèles d’intelligence artificielle ?
Gemma 3n est un modèle d’intelligence artificielle multimodal développé par Google, conçu pour fonctionner efficacement sur des appareils avec des capacités hardware limitées. Sa principale innovation est l’architecture Per-Layer, qui optimise la consommation de RAM tout en maintenant de très bonnes performances sur divers benchmarks.

Comment Gemma 3n parvient-il à réduire son empreinte mémoire ?
La technique Per-Layer Embeddings utilisée dans Gemma 3n permet de réduire dynamiquement l’utilisation de la mémoire vive en optimisant les représentations de chaque couche, ce qui fait que le modèle génère des performances similaires à des modèles avec moins de paramètres.

Quels types de données Gemma 3n peut-il traiter ?
Gemma 3n est entièrement multimodal et conçu pour traiter du texte, de l’audio, de la vidéo, et des images, bien que la version actuelle se concentre principalement sur les modalités texte et images. D’autres mises à jour futures devraient élargir ses capacités.

Quel est le score de performance de Gemma 3n par rapport à d’autres modèles ?
Sur la Chatbot Arena, Gemma 3n atteint un score Elo de 1269, se plaçant juste derrière Claude 3.7 Sonnet et devant d’autres modèles comme GPT-4.1. De plus, il affiche des résultats impressionnants sur des benchmarks classiques tels que MMLU et HumanEval.

Est-ce que Gemma 3n est disponible en open source et quelles en sont les conditions d’utilisation ?
Oui, Gemma 3n est disponible en open source. Les utilisateurs peuvent l’utiliser à des fins commerciales sans frais de licence, mais Google se réserve le droit de restreindre son utilisation si elle viole ses conditions d’utilisation, notamment pour des contenus protégés par le droit d’auteur.

Quelles sont les applications pratiques recommandées pour Gemma 3n ?
Gemma 3n est recommandé pour diverses applications telles que la génération de texte, l’utilisation en mode chatbot, le résumé d’informations, ainsi que l’analyse visuelle et la transcription de fichiers audio, grâce à sa taille réduite et son optimisation pour l’inférence sur mobile.

Comment les développeurs peuvent-ils personnaliser Gemma 3n selon leurs besoins ?
Les développeurs peuvent créer plusieurs tailles de sous-modèle dans Gemma 3n grâce à l’architecture du MatFormer, qui permet d’intégrer nativement un sous-modèle optimisé selon la complexité de chaque tâche, réduisant ainsi les besoins en ressources.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsGemma 3n : Google réduit la taille de l'intelligence artificielle de pointe

Taco Bell reconsidère son choix d’utiliser l’IA au drive-in

découvrez comment taco bell reconsidère l'utilisation de l'intelligence artificielle pour améliorer l'expérience au drive-in, entre innovation technologique et attentes des clients.
découvrez comment un électrocardiogramme intelligent révolutionne le diagnostic cardiaque. grâce à cette technologie innovante, les médecins détectent les maladies cardiaques plus rapidement et avec une précision accrue, offrant ainsi des soins optimisés aux patients.
taco bell ralentit le déploiement de ses drive-in intelligents en raison de problèmes techniques et de comportements inappropriés, mettant ainsi en pause sa transformation numérique pour garantir la sécurité et la qualité du service.
découvrez comment l'intelligence artificielle transforme les relations clients grâce à l'émergence des agents interactifs : des solutions innovantes pour personnaliser et améliorer l'expérience client.

Google Meet : Guide pour activer la fonctionnalité de traduction vocale en français

découvrez comment activer facilement la traduction vocale en français sur google meet grâce à notre guide complet. simplifiez vos réunions multilingues en quelques étapes simples !

L’Intelligence Artificielle : Un Outil, Pas une Évasion pour l’Écriture

découvrez pourquoi l'intelligence artificielle doit être considérée comme un outil d'aide à l'écriture plutôt qu'une échappatoire, et comment elle peut enrichir votre créativité sans remplacer l'essence humaine.