Gemma 3n : Google reduziert die Größe der fortschrittlichen künstlichen Intelligenz

Publié le 24 Mai 2025 à 09h46
modifié le 24 Mai 2025 à 09h47

Gemma 3n definiert die Standards der künstlichen Intelligenz mit einer signifikanten Reduzierung der Größe neu. Google revolutioniert die Inferenz mit seinem extrem leistungsfähigen Modell, das für Geräte optimiert ist. Eine innovative Architektur überwindet die Leistungsgrenzen bei begrenzten Ressourcen. Dieses multimodale SLM kombiniert Text, Audio, Video und Bilder, während es eine bemerkenswerte Effizienz beibehält. Die durch Gemma 3n ausgelösten Transformationen könnten unsere Interaktion mit Technologie neu definieren und den Zugang zu fortschrittlicher künstlicher Intelligenz vereinfachen.

Präsentation von Gemma 3n

Google hat kürzlich das Gemma 3n Modell, ein innovatives multimodales Sprachsystem (SLM), auf der Google I/O 2025 präsentiert. Dieses Modell, das vom Team DeepMind entwickelt wurde, zeichnet sich durch seine Fähigkeit aus, Daten in verschiedenen Formen wie Text, Audio, Video und Bildern zu verarbeiten. Sein Design wurde für die Inferenz auf CPUs optimiert, was es auf Geräten mit begrenzten Ressourcen zugänglich macht.

Eine innovative Architektur

Die Modellfamilie Gemma integriert technologische Fortschritte ihres Vorgängers, Gemini. Die Ingenieure von DeepMind haben einen radikalen Ansatz gewählt und eine neue Architektur entwickelt, die für den Einsatz auf weniger leistungsfähigen Geräten optimiert ist. Die bedeutende Innovation, genannt Per-Layer, reduziert den RAM-Verbrauch erheblich. So funktioniert Gemma 3n, ausgestattet mit 5 oder 8 Milliarden Parametern, mit einem Speicherausdruck, der weit unter dem ähnlicher Modelle liegt.

Leistung und Benchmarks

Auf Referenzplattformen wie der Chatbot Arena erzielt Gemma 3n einen beeindruckenden Elo-Score von 1269 und platziert sich damit direkt hinter Claude 3.7 Sonnet. Die Leistung ist umso bemerkenswerter für ein Modell dieser Größe. Die Ergebnisse auf traditionellen Benchmarks, wie 64,9% auf MMLU und 63,6% auf MBPP, bestätigen seinen Status als außergewöhnliches Modell.

Technische Spezifikationen

Der MatFormer, eine weitere Innovation der Architektur, ermöglicht die Integration eines Untermodells mit 2 Milliarden Parametern. Diese Funktion hilft, die Größe der Modelle je nach Komplexität der Aufgaben anzupassen. Entwickler können verschiedene Größen von Untermodellen reproduzieren, um die Effizienz der genutzten Ressourcen zu maximieren.

Zugänglichkeit und Nutzung

Gemma 3n ist bereits kostenlos über Google AI Studio zugänglich, und Nutzer können auch die Modellgewichte auf Hugging Face herunterladen. Derzeit ermöglicht die ausgegebene Version nur die Verarbeitung der Modalitäten Text und Bilder, aber Updates sind in Arbeit, um alle Modalitäten zu integrieren.

Nutzungsbedingungen

Die Nutzung dieses Modells zu kommerziellen Zwecken verursacht keine Lizenzgebühren oder Tantiemen für Google. Dennoch gelten einige Einschränkungen. Die Verwendung von Gemma 3n ist untersagt für die Erstellung von geschützten oder illegalen Inhalten. Die automatisierte Entscheidungsfindung in Bereichen, die die individuellen Rechte betreffen, wie Finanzen oder Gesundheit, ist ebenfalls verboten.

Empfohlene Anwendungen

Gemma 3n setzt einen neuen Maßstab im Bereich der Open-Source-SLM. Google empfiehlt seine Integration für die Textgenerierung, die Zusammenfassung von Informationen, die visuelle Analyse und die Audio-Transkription. Eine bemerkenswerte Eigenschaft ist seine Optimierung für Inferenz auf Mobilgeräte, mit einem RAM-Bedarf von nur 3924 MB, was es ideal macht, um neue Anwendungen zu erkunden, wie sie in diesen Projekten erwähnt werden: Reachy 2, OpenAI und KI in Unternehmen.

Fazit über seine Überlegenheit

Gemma 3n vereint Leistung und Modularität in einem kompakten Format. Dieses Modell, das mit den neuesten Fortschritten in der künstlichen Intelligenz im Einklang steht, verkörpert eine präzise Antwort auf die wachsende Nachfrage nach Effizienz in SLM. Seine reduzierte Größe steht im Kontrast zu seinen beeindruckenden Ergebnissen auf spezifischen Benchmarks und ermöglicht es ihm, an der technologischen Konkurrenz führend zu sein.

Benutzer-FAQ zu Gemma 3n: Google reduziert die Größe der fortschrittlichen künstlichen Intelligenz

Was ist Gemma 3n und wie unterscheidet es sich von anderen Modellen der künstlichen Intelligenz?
Gemma 3n ist ein multimodales künstliches Intelligenzmodell, das von Google entwickelt wurde und für eine effiziente Nutzung auf Geräten mit begrenzten Hardwarefähigkeiten konzipiert ist. Seine Hauptinnovation ist die Per-Layer-Architektur, die den RAM-Verbrauch optimiert und dabei sehr gute Leistungsdaten auf verschiedenen Benchmarks aufrechterhält.

Wie gelingt es Gemma 3n, seinen Speicherbedarf zu reduzieren?
Die in Gemma 3n verwendete Per-Layer-Embeddings-Technik ermöglicht es, den Verbrauch des Arbeitsspeichers dynamisch zu reduzieren, indem sie die Darstellungen jeder Schicht optimiert, was dazu führt, dass das Modell ähnliche Leistungen wie Modelle mit weniger Parametern erzielt.

Welche Arten von Daten kann Gemma 3n verarbeiten?
Gemma 3n ist vollständig multimodal und dafür geeignet, Text, Audio, Video und Bilder zu verarbeiten, obwohl die aktuelle Version sich hauptsächlich auf die Modalitäten Text und Bilder konzentriert. Weitere zukünftige Updates sollen seine Fähigkeiten erweitern.

Wie schneidet Gemma 3n im Vergleich zu anderen Modellen ab?
Auf der Chatbot Arena erreicht Gemma 3n einen Elo-Score von 1269 und platziert sich damit direkt hinter Claude 3.7 Sonnet und vor anderen Modellen wie GPT-4.1. Darüber hinaus zeigt es beeindruckende Ergebnisse auf klassischen Benchmarks wie MMLU und HumanEval.

Ist Gemma 3n Open Source verfügbar und was sind die Nutzungsbedingungen?
Ja, Gemma 3n ist Open Source verfügbar. Nutzer dürfen es für kommerzielle Zwecke ohne Lizenzgebühren verwenden, jedoch behält sich Google das Recht vor, seine Nutzung einzuschränken, wenn sie gegen die Nutzungsbedingungen verstößt, insbesondere bei geschützten Inhalten.

Welche praktischen Anwendungen werden für Gemma 3n empfohlen?
Gemma 3n wird für verschiedene Anwendungen empfohlen, wie z.B. die Textgenerierung, die Nutzung als Chatbot, die Zusammenfassung von Informationen, sowie die visuelle Analyse und die Transkription von Audiodateien, dank seiner reduzierten Größe und seiner Optimierung für mobile Inferenz.

Wie können Entwickler Gemma 3n an ihre Bedürfnisse anpassen?
Entwickler können in Gemma 3n mehrere Größen von Untermodellen erstellen, dank der MatFormer-Architektur, die die native Integration eines Untermodells ermöglicht, das je nach Komplexität der jeweiligen Aufgabe optimiert ist, wodurch der Ressourcenbedarf reduziert wird.

actu.iaNon classéGemma 3n : Google reduziert die Größe der fortschrittlichen künstlichen Intelligenz

Die KI erfindet das Rezept für Beton in einer Studie des MIT neu

découvrez comment l'intelligence artificielle révolutionne la fabrication du béton selon une étude récente du mit. cette innovation promet d'améliorer la durabilité et l'efficacité énergétique des matériaux de construction.

Lehren, KI-Modelle wie Menschen zu skizzieren

découvrez comment former des modèles d'intelligence artificielle à esquisser avec la finesse et la créativité des humains. plongez dans les techniques innovantes d'apprentissage qui permettent aux ia de reproduire l'art de l'esquisse, alliant technologie et expression artistique.
découvrez comment l'un des fondateurs les plus prospères d'afrique révolutionne le secteur de la technologie avec sa nouvelle startup d'intelligence artificielle, qui a déjà attiré 9 millions de dollars d'investissements. explorez les opportunités et innovations qu'elle apporte au continent.

ein Start-up gibt bekannt, dass ihre künstliche Intelligenz von 700 Menschen unterstützt wurde

découvrez comment une start-up révolutionnaire révèle que son intelligence artificielle a été développée grâce à l'apport de 700 experts humains, alliant innovation technologique et expertise collaborative.

Die Ära der supersonischen KI ist gestartet

découvrez comment l'ère de l'intelligence artificielle supersonique transforme notre quotidien, propulsant des innovations incroyables et redéfinissant le paysage technologique. plongez dans un avenir où l'ia booste l'efficacité et la créativité comme jamais auparavant.

Reddit klagt Anthropic wegen unerlaubter Nutzung von KI-Daten an

reddit a engagé des poursuites contre anthropic, l'accusant d'exploitation illégale de données d'intelligence artificielle. découvrez les détails de cette affaire qui soulève des questions importantes sur l'utilisation des données et les droits d'auteur dans le domaine de l'ia.