Gemma 3n : Google reduce el tamaño de la inteligencia artificial de vanguardia

Publié le 24 mayo 2025 à 09h41
modifié le 24 mayo 2025 à 09h41

Gemma 3n redefine los estándares de la inteligencia artificial con una reducción significativa de tamaño. Google revoluciona la inferencia con su modelo extremadamente eficiente adaptado a dispositivos. Una arquitectura innovadora rompe las barreras del rendimiento frente a recursos limitados. Este SLM multimodal combina texto, audio, video e imagen, manteniendo una eficiencia notable. Las transformaciones generadas por Gemma 3n podrían redefinir nuestra interacción con la tecnología, simplificando el acceso a la inteligencia artificial avanzada.

Presentación de Gemma 3n

Google ha revelado recientemente el modelo Gemma 3n, un sistema de lenguaje multimodal (SLM) innovador, durante Google I/O 2025. Este modelo, desarrollado por el equipo de DeepMind, se distingue por su capacidad para procesar datos en diversas formas como texto, audio, video e imágenes. Su diseño ha sido optimizado para la inferencia en CPU, lo que lo hace accesible en dispositivos con recursos limitados.

Una arquitectura innovadora

La familia de modelos Gemma integra los avances tecnológicos derivados de su predecesor, Gemini. Los ingenieros de DeepMind han adoptado un enfoque radical al desarrollar una nueva arquitectura dedicada para su uso en dispositivos menos potentes. La innovación principal, llamada Per-Layer, reduce significativamente el consumo de RAM. Así, Gemma 3n, equipado con 5 u 8 mil millones de parámetros, funciona con una huella de memoria significativamente inferior a la de modelos similares.

Rendimiento y benchmarks

En plataformas de referencia como la Chatbot Arena, Gemma 3n obtiene una puntuación Elo impresionante de 1269, colocándose justo detrás de Claude 3.7 Sonnet. El rendimiento es aún más notable para un modelo de este tamaño. Los resultados en benchmarks tradicionales, como 64.9% en MMLU y 63.6% en MBPP, confirman su estatus de modelo excepcional.

Especificaciones técnicas

El MatFormer, otra innovación de la arquitectura, permite la integración de un submodelo de 2 mil millones de parámetros. Esta funcionalidad ayuda a adaptar el tamaño de los modelos según la complejidad de las tareas. Los desarrolladores pueden así recrear diversas tamaños de submodelo, maximizando la eficiencia de los recursos utilizados.

Accesibilidad y uso

Gemma 3n ya está disponible a través de Google AI Studio sin costo, y los usuarios también pueden descargar los pesos del modelo en Hugging Face. Actualmente, la versión desplegada solo permite el procesamiento de modalidades de texto e imágenes, pero se están realizando actualizaciones para integrar todas las modalidades.

Condiciones de uso

Utilizar este modelo para fines comerciales no incurre en ninguna tarifa de licencia ni regalías para Google. Sin embargo, se aplican ciertas restricciones. El uso de Gemma 3n está prohibido para la generación de contenido protegido o ilegal. La toma de decisiones automatizadas en sectores que afectan los derechos individuales, como la finanza o la salud, también está prohibida.

Aplicaciones recomendadas

Gemma 3n establece un nuevo referente en el ámbito de los SLM de código abierto. Google recomienda su integración para la generación de texto, el resumen de información, el análisis visual y la transcripción de audio. Una característica notable es su optimización para la inferencia en móviles, con una necesidad de RAM limitada a solo 3924 MB, lo que lo hace ideal para explorar nuevos usos, como se menciona en estos proyectos: Reachy 2, OpenAI y la IA en empresas.

Conclusión sobre su superioridad

Gemma 3n yuxtapone rendimiento y modularidad en un aspecto compacto. Este modelo, alineado con los últimos avances en inteligencia artificial, encarna una respuesta precisa a la creciente demanda de eficiencia en los SLM. Su tamaño reducido contrasta con sus resultados impresionantes en benchmarks específicos, permitiéndole posicionarse a la cabeza de la competencia tecnológica.

FAQ de usuarios sobre Gemma 3n: Google reduce el tamaño de la inteligencia artificial de vanguardia

¿Qué es Gemma 3n y en qué se diferencia de otros modelos de inteligencia artificial?
Gemma 3n es un modelo de inteligencia artificial multimodal desarrollado por Google, diseñado para funcionar eficientemente en dispositivos con capacidades de hardware limitadas. Su principal innovación es la arquitectura Per-Layer, que optimiza el consumo de RAM manteniendo un rendimiento muy bueno en diversos benchmarks.

¿Cómo logra Gemma 3n reducir su huella de memoria?
La técnica Per-Layer Embeddings utilizada en Gemma 3n permite reducir dinámicamente el uso de la memoria RAM al optimizar las representaciones de cada capa, lo que hace que el modelo genere rendimientos similares a los de modelos con menos parámetros.

¿Qué tipos de datos puede procesar Gemma 3n?
Gemma 3n es completamente multimodal y está diseñado para procesar texto, audio, video e imágenes, aunque la versión actual se centra principalmente en las modalidades de texto e imágenes. Otras actualizaciones futuras deberían ampliar sus capacidades.

¿Cuál es el puntaje de rendimiento de Gemma 3n en comparación con otros modelos?
En la Chatbot Arena, Gemma 3n alcanza una puntuación Elo de 1269, colocándose justo detrás de Claude 3.7 Sonnet y delante de otros modelos como GPT-4.1. Además, muestra resultados impresionantes en benchmarks clásicos como MMLU y HumanEval.

¿Está Gemma 3n disponible como código abierto y cuáles son las condiciones de uso?
Sí, Gemma 3n está disponible como código abierto. Los usuarios pueden utilizarlo para fines comerciales sin costo de licencia, pero Google se reserva el derecho de restringir su uso si viola sus condiciones de uso, particularmente para contenidos protegidos por derechos de autor.

¿Cuáles son las aplicaciones prácticas recomendadas para Gemma 3n?
Gemma 3n es recomendado para diversas aplicaciones como la generación de texto, el uso en modo chatbot, el resumen de información, así como el análisis visual y la transcripción de archivos de audio, gracias a su tamaño reducido y su optimización para la inferencia en móviles.

¿Cómo pueden los desarrolladores personalizar Gemma 3n según sus necesidades?
Los desarrolladores pueden crear múltiples tamaños de submodelo en Gemma 3n gracias a la arquitectura del MatFormer, que permite integrar de forma nativa un submodelo optimizado según la complejidad de cada tarea, reduciendo así las necesidades de recursos.

actu.iaNon classéGemma 3n : Google reduce el tamaño de la inteligencia artificial de...

la IA reinventa la receta del concreto en un estudio del MIT

découvrez comment l'intelligence artificielle révolutionne la fabrication du béton selon une étude récente du mit. cette innovation promet d'améliorer la durabilité et l'efficacité énergétique des matériaux de construction.

enseñar a los modelos de ia a esbozar como humanos

découvrez comment former des modèles d'intelligence artificielle à esquisser avec la finesse et la créativité des humains. plongez dans les techniques innovantes d'apprentissage qui permettent aux ia de reproduire l'art de l'esquisse, alliant technologie et expression artistique.

Uno de los fundadores más prósperos de África lanza una nueva startup de IA y ya ha recaudado 9...

découvrez comment l'un des fondateurs les plus prospères d'afrique révolutionne le secteur de la technologie avec sa nouvelle startup d'intelligence artificielle, qui a déjà attiré 9 millions de dollars d'investissements. explorez les opportunités et innovations qu'elle apporte au continent.

una start-up revela que su inteligencia artificial fue respaldada por 700 humanos

découvrez comment une start-up révolutionnaire révèle que son intelligence artificielle a été développée grâce à l'apport de 700 experts humains, alliant innovation technologique et expertise collaborative.

La era de la IA supersónica ha comenzado

découvrez comment l'ère de l'intelligence artificielle supersonique transforme notre quotidien, propulsant des innovations incroyables et redéfinissant le paysage technologique. plongez dans un avenir où l'ia booste l'efficacité et la créativité comme jamais auparavant.

Reddit demandó a Anthropic por la explotación ilegal de datos de IA

reddit a engagé des poursuites contre anthropic, l'accusant d'exploitation illégale de données d'intelligence artificielle. découvrez les détails de cette affaire qui soulève des questions importantes sur l'utilisation des données et les droits d'auteur dans le domaine de l'ia.