NVIDIA unterstützt sofort das neue Modell von Google. DiffusionGemma kommt auf RTX

Calendar 6/11/2026

Der Wettbewerb auf dem Markt für künstliche Intelligenz kommt nicht zur Ruhe. Google DeepMind hat offiziell DiffusionGemma vorgestellt, ein neues offenes KI-Modell, das für die sehr schnelle Generierung von Inhalten konzipiert wurde. Kurz nach der Premiere gab NVIDIA volle Unterstützung für die Lösung auf seinen RTX- und DGX-Plattformen bekannt. Der Hersteller überzeugt, dass Benutzer dank entsprechender Optimierungen mit einer deutlich höheren Leistung und einer lokalen Ausführung des Modells ohne die Notwendigkeit von Cloud-Diensten rechnen können.

DiffusionGemma soll die Textgenerierung beschleunigen

Das neue Modell, das von Google entwickelt wurde, basiert auf der Architektur Gemma 4 und verwendet einen anderen Ansatz als klassische autoregressive Modelle. Anstatt einzelne Tokens Schritt für Schritt zu generieren, kann DiffusionGemma größere Chargen gleichzeitig verarbeiten. In der Praxis ermöglicht dies eine erhebliche Verkürzung der Zeit, die für die Erstellung von Antworten benötigt wird. Das Modell verfügt über mehr als 25 Milliarden Parameter, jedoch sind während des Betriebs nur ein Teil von ihnen aktiv, was die Recheneffizienz verbessert. Google hebt auch den offenen Charakter des Projekts hervor. DiffusionGemma wird unter der Apache 2.0-Lizenz bereitgestellt, sodass Entwickler und Unternehmen die Lösung frei nutzen und eigene Projekte basierend auf dieser Technologie entwickeln können. Das Modell unterstützt sowohl Text als auch Bilder, und sein maximaler Kontext reicht bis zu 256.000 Tokens. Das macht es möglich, es in vielen fortgeschrittenen Anwendungen im Bereich Datenanalyse, Inhaltserstellung oder dem Bau von KI-Agenten zu verwenden. Laut den Entwicklern bleibt jedoch die größte Stärke die Geschwindigkeit. In einigen Szenarien soll das Modell sogar bis zu viermal schneller sein als traditionelle Lösungen, die auf sequenzieller Generierung basieren.

wccftech

NVIDIA hat am Veröffentlichungstag Unterstützung bereitgestellt

NVIDIA hat die Veröffentlichung des neuen Modells schnell genutzt und bereitwillige Umgebungen für den Betrieb auf eigener Hardware präsentiert. Die Unterstützung umfasst sowohl GeForce RTX-Karten für Privatanwender als auch professionelle RTX PRO-Plattformen und AI-Computer aus der DGX-Familie. Das Unternehmen behauptet, dass durch die Nutzung von Tensor-Kernen und CUDA-Technologie sehr hohe Leistungen erzielt werden können, ohne dass eine zusätzliche Konfiguration erforderlich ist. Besonders interessant sind die Ergebnisse, die von DGX-Systemen erreicht werden. Laut den Daten des Herstellers kann DGX Spark etwa 150 Token pro Sekunde generieren, während fortschrittlichere Konfigurationen sogar mehrere Hundert Token pro Sekunde während des lokalen Betriebs des Modells erreichen. NVIDIA betont auch, dass Benutzer keine Cloud-Dienste nutzen oder für jede generierte Anfrage bezahlen müssen. Das gesamte System kann direkt auf einem Computer betrieben werden, der mit der entsprechenden Hardware ausgestattet ist. Dies ist ein wichtiges Argument für Personen, die sich mit der Entwicklung von künstlicher Intelligenz beschäftigen, die immer häufiger nach lokalen Lösungen suchen, die eine größere Kontrolle über die Daten ermöglichen. Schon jetzt kann DiffusionGemma unter anderem auf der GeForce RTX 5090 und auf DGX-Plattformen mit den neuesten NVIDIA-Chipsätzen betrieben werden.

DiffusionGemma ist ein neues offenes KI-Modell von Google DeepMind, das auf sehr schnelle Inhaltserstellung und lokale Funktionalität setzt. NVIDIA hat von Anfang an umfassende Unterstützung für seine RTX-Karten und DGX-Systeme bereitgestellt und bietet zusätzliche Optimierungen zur Leistungssteigerung an. Alles deutet darauf hin, dass das neue Modell eine interessante Alternative zu den derzeit von Entwicklern und KI-Enthusiasten genutzten beliebten Lösungen werden könnte.

Quelle; wccftech

Redakcja Choose TV Avatar
Redakcja Choose TV

ChooseTVteam-title