Gemma 3n : Google réduit la taille de l’intelligence artificielle de pointe

Publié le 24 mai 2025 à 09h10
modifié le 24 mai 2025 à 09h10
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

Gemma 3n redéfinit les standards de l’intelligence artificielle avec une réduction significative de taille. Google révolutionne l’inférence avec son modèle extrêmement performant adapté aux appareils. Une architecture innovante brise les barrières de la performance face à des ressources limitées. Ce SLM multimodal combine texte, audio, vidéo et image, tout en maintenant une efficacité remarquable. Les transformations engendrées par Gemma 3n pourraient redéfinir notre interaction avec la technologie, simplifiant l’accès à l’intelligence artificielle avancée.

Présentation de Gemma 3n

Google a récemment dévoilé le modèle Gemma 3n, un système de langage multimodal (SLM) innovant, lors de Google I/O 2025. Ce modèle, développé par l’équipe de DeepMind, se distingue par sa capacité à traiter des données sous diverses formes telles que le texte, l’audio, la vidéo et les images. Sa conception a été optimisée pour l’inférence sur CPU, ce qui le rend accessible sur des appareils disposant de ressources limitées.

Une architecture novatrice

La famille des modèles Gemma intègre les avancées technologiques issues de son prédécesseur, Gemini. Les ingénieurs de DeepMind ont adopté une approche radicale en développant une nouvelle architecture dédiée à l’utilisation sur des appareils moins puissants. L’innovation majeure, nommée Per-Layer, réduit significativement la consommation de RAM. Ainsi, Gemma 3n, équipé de 5 ou 8 milliards de paramètres, fonctionne avec une empreinte mémoire largement inférieure à celle de modèles similaires.

Performance et benchmarks

Sur des plateformes de référence comme la Chatbot Arena, Gemma 3n obtient un score Elo impressionnant de 1269, le plaçant juste derrière Claude 3.7 Sonnet. La performance est d’autant plus remarquable pour un modèle de cette taille. Les résultats sur des benchmarks traditionnels, comme 64,9% sur MMLU et 63,6% sur MBPP, confirment son statut de modèle d’exception.

Spécificités techniques

Le MatFormer, une autre innovation de l’architecture, permet l’intégration d’un sous-modèle de 2 milliards de paramètres. Cette fonctionnalité aide à adapter la taille des modèles en fonction de la complexité des tâches. Les développeurs peuvent ainsi recréer diverses tailles de sous-modèle, maximisant l’efficacité des ressources utilisées.

Accessibilité et utilisation

Gemma 3n est d’ores et déjà accessible via Google AI Studio sans frais, et les utilisateurs peuvent également télécharger les poids du modèle sur Hugging Face. Actuellement, la version déployée permet uniquement le traitement des modalités texte et images, mais des mises à jour sont en cours pour intégrer toutes les modalités.

Conditions d’utilisation

Utiliser ce modèle à des fins commerciales n’entraîne aucun frais de licence ni redevances pour Google. Néanmoins, certaines restrictions s’appliquent. L’utilisation de Gemma 3n est interdite pour la génération de contenus protégés ou illégaux. La prise de décisions automatisées dans des secteurs affectant les droits individuels, tels que la finance ou la santé, est également prohibée.

Applications recommandées

Gemma 3n établit une nouvelle référence dans le domaine des SLM open source. Google recommande son intégration pour la génération de texte, le résumé d’informations, l’analyse visuelle et la transcription audio. Une caractéristique notable est son optimisation pour l’inférence sur mobile, avec un besoin en RAM limité à seulement 3924 Mo, ce qui le rend idéal pour explorer de nouveaux usages, tels que mentionné dans ces projets : Reachy 2, OpenAI et l’IA en entreprise.

Conclusion sur sa supériorité

Gemma 3n juxtapose performance et modularité dans un aspect compact. Ce modèle, en phase avec les dernières avancées en intelligence artificielle, incarne une réponse précise à la demande croissante d’efficacité dans les SLM. Sa taille réduite contraste avec ses résultats impressionnants sur des benchmarks spécifiques, lui permettant de se positionner en tête de la compétition technologique.

FAQ utilisateur sur Gemma 3n : Google réduit la taille de l’intelligence artificielle de pointe

Qu’est-ce que Gemma 3n et en quoi se distingue-t-il des autres modèles d’intelligence artificielle ?
Gemma 3n est un modèle d’intelligence artificielle multimodal développé par Google, conçu pour fonctionner efficacement sur des appareils avec des capacités hardware limitées. Sa principale innovation est l’architecture Per-Layer, qui optimise la consommation de RAM tout en maintenant de très bonnes performances sur divers benchmarks.

Comment Gemma 3n parvient-il à réduire son empreinte mémoire ?
La technique Per-Layer Embeddings utilisée dans Gemma 3n permet de réduire dynamiquement l’utilisation de la mémoire vive en optimisant les représentations de chaque couche, ce qui fait que le modèle génère des performances similaires à des modèles avec moins de paramètres.

Quels types de données Gemma 3n peut-il traiter ?
Gemma 3n est entièrement multimodal et conçu pour traiter du texte, de l’audio, de la vidéo, et des images, bien que la version actuelle se concentre principalement sur les modalités texte et images. D’autres mises à jour futures devraient élargir ses capacités.

Quel est le score de performance de Gemma 3n par rapport à d’autres modèles ?
Sur la Chatbot Arena, Gemma 3n atteint un score Elo de 1269, se plaçant juste derrière Claude 3.7 Sonnet et devant d’autres modèles comme GPT-4.1. De plus, il affiche des résultats impressionnants sur des benchmarks classiques tels que MMLU et HumanEval.

Est-ce que Gemma 3n est disponible en open source et quelles en sont les conditions d’utilisation ?
Oui, Gemma 3n est disponible en open source. Les utilisateurs peuvent l’utiliser à des fins commerciales sans frais de licence, mais Google se réserve le droit de restreindre son utilisation si elle viole ses conditions d’utilisation, notamment pour des contenus protégés par le droit d’auteur.

Quelles sont les applications pratiques recommandées pour Gemma 3n ?
Gemma 3n est recommandé pour diverses applications telles que la génération de texte, l’utilisation en mode chatbot, le résumé d’informations, ainsi que l’analyse visuelle et la transcription de fichiers audio, grâce à sa taille réduite et son optimisation pour l’inférence sur mobile.

Comment les développeurs peuvent-ils personnaliser Gemma 3n selon leurs besoins ?
Les développeurs peuvent créer plusieurs tailles de sous-modèle dans Gemma 3n grâce à l’architecture du MatFormer, qui permet d’intégrer nativement un sous-modèle optimisé selon la complexité de chaque tâche, réduisant ainsi les besoins en ressources.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsGemma 3n : Google réduit la taille de l'intelligence artificielle de pointe

Des passants choqués par un panneau publicitaire d’IA un brin trop sincère

des passants ont été surpris en découvrant un panneau publicitaire généré par l’ia, dont le message étonnamment honnête a suscité de nombreuses réactions. découvrez les détails de cette campagne originale qui n’a laissé personne indifférent.

Apple commence l’expédition d’un produit phare fabriqué au Texas

apple débute l’expédition de son produit phare fabriqué au texas, renforçant sa présence industrielle américaine. découvrez comment cette initiative soutient l’innovation locale et la production nationale.
plongez dans les coulisses du fameux vol au louvre grâce au témoignage captivant du photographe derrière le cliché viral. entre analyse à la sherlock holmes et usage de l'intelligence artificielle, découvrez les secrets de cette image qui a fait le tour du web.

Une entreprise innovante en quête d’employés aux valeurs claires et transparentes

rejoignez une entreprise innovante qui recherche des employés partageant des valeurs claires et transparentes. participez à une équipe engagée où intégrité, authenticité et esprit d'innovation sont au cœur de chaque projet !

Microsoft Edge : le navigateur transformé par le Mode Copilot, une IA au service de votre navigation !

découvrez comment le mode copilot de microsoft edge révolutionne votre expérience de navigation grâce à l’intelligence artificielle : conseils personnalisés, assistance instantanée et navigation optimisée au quotidien !

L’Union Européenne : Une régulation prudente face aux géants de la Big Tech américaine

découvrez comment l'union européenne impose une régulation stricte et réfléchie aux grandes entreprises technologiques américaines, afin de protéger les consommateurs et d’assurer une concurrence équitable sur le marché numérique.