Nvidia Vera Rubin: KI-Riese setzt auf komplette Rack-Systeme

15.01.2026 - 17:22:12

Nvidia stellt mit der Vera-Rubin-Plattform vollständig integrierte KI-Supercomputer vor, die einen massiven Leistungssprung für Training und Inferenz versprechen und die Systemarchitektur neu definieren.

Nvidia Vera Rubin: KI-Riese setzt auf komplette Rack-Systeme - Foto: über boerse-global.de

Nvidia revolutioniert den KI-Markt mit einer neuen Plattform, die nicht nur Chips, sondern komplette Supercomputer liefert. Das „Vera Rubin“-System soll die nächste Generation intelligenter KI-Agenten antreiben und setzt damit den Kurs für die kommenden Jahre fest.

Vom Chip-Lieferanten zum System-Architekten

Der Tech-Riese vollzieht eine strategische Wende: Statt einzelner Grafikprozessoren (GPUs) bietet Nvidia mit Vera Rubin nun vollständig integrierte KI-Supercomputer im Rack-Format an. Diese Plattform-Strategie zielt direkt auf die Bedürfnisse moderner „KI-Fabriken“ von Hyperscalern und Großunternehmen. Kern der Architektur sind sechs spezialisierte, aufeinander abgestimmte Chips – darunter der neue Rubin GPU und der Vera CPU.

Das Flaggschiff, das Vera Rubin NVL72, ist ein flüssigkeitsgekühltes Rack-System mit 72 Rubin-GPUs und 36 Vera-CPUs. Nvidia kontrolliert damit die gesamte Hardware-Stack und bietet eine schlüsselfertige Infrastruktur für den Betrieb hochkomplexer KI-Modelle. Der Ansatz soll Engpässe bei der Datenkommunikation beseitigen, die heute oft das Limit für riesige KI-Modelle darstellen.

Passend zum Thema: Unternehmen, die eigene KI‑Systeme planen oder betreiben — etwa Rechenzentren mit spezialisierten GPUs wie Nvidias NVL72 — stehen unter neuen regulatorischen Pflichten: Kennzeichnung, Risikobewertung und Dokumentation. Der kostenlose Umsetzungsleitfaden zur EU‑KI‑Verordnung erklärt verständlich, welche Anforderungen jetzt gelten, wie Sie Ihr System richtig klassifizieren und welche Fristen drohen. Ideal für IT‑Leiter, Entwickler und Compliance‑Teams. Jetzt kostenlosen KI‑Verordnungs‑Leitfaden sichern

Rekord-Leistung für KI-Training und -Inferenz

Im Herzen der Plattform schlägt der neue Rubin-Grafikprozessor. Nvidia verspricht einen gewaltigen Sprung gegenüber der aktuellen Blackwell-Architektur: Die KI-Inferenz soll fünfmal schneller ablaufen, das Training von Modellen 3,5-mal rascher. Jede Rubin-GPU soll 50 Petaflops an FP4-Rechenleistung für KI-Anwendungen bringen.

Technisch setzt der Chip auf eine dritte Generation der „Transformer Engine“, 224 Streaming-Multiprozessoren mit Tensor-Cores der sechsten Generation und neuesten HBM4-Speicher. Mit 288 GB Kapazität und einer Bandbreite von bis zu 22 TB/s pro GPU soll der Speicherflaschenhals der Vergangenheit angehören. Der Partner im System, der Vera-CPU, übernimmt mit 88 eigenen Arm-Kernen die Orchestrierung des Datenflusses, um die GPUs stets optimal auszulasten.

Rack-weite Vernetzung als Schlüssel zum Erfolg

Die wahre Stärke der Plattform liegt in ihrer Vernetzung. Die sechste Generation der NVLink-Technologie ermöglicht eine bidirektionale Bandbreite von 3,6 TB/s zwischen den GPUs. In einem einzigen NVL72-Rack summiert sich das auf eine aggregierte Bandbreite von 260 TB/s – eine Voraussetzung für massiv paralleles Rechnen.

Zusammen mit den neuen ConnectX-9-SuperNICs und dem Spectrum-X-Ethernet soll dies den nahtlosen Aufbau von KI-Supercomputern aus Millionen von GPUs über Rack-Grenzen hinweg ermöglichen. Diese Fokussierung auf extreme Verbindungsgeschwindigkeiten ist kein Zufall: Sie ist essenziell für die kommende Ära der agentischen KI. Diese Systeme sollen nicht nur Informationen abrufen, sondern denken, schlussfolgern und komplexe, mehrstufige Aufgaben autonom ausführen.

Deutliches Signal an den Wettbewerb und die Kunden

Die Ankündigung auf der CES 2026 unterstreicht Nvidias aggressiven Innovationsrhythmus von nur einem Jahr zwischen Architektur-Generationen. Damit setzt das Unternehmen Wettbewerber wie AMD oder auch eigene Kunden wie Google und Amazon unter Druck, die an eigenen KI-Chips arbeiten.

Bereits für 2027 kündigte CEO Jensen Huang mit „Rubin Ultra“ die nächste Steigerung an, die die Leistung pro GPU auf 100 Petaflops verdoppeln soll. Die Botschaft ist klar: Nvidia sieht die Zukunft der KI-Infrastruktur in integrierten, rack-scale-Systemen – und nicht in losen Komponenten. Für deutsche DAX-Konzerne und Forschungseinrichtungen, die in KI investieren, wird die Entscheidung für oder gegen Nvidias geschlossenes Ökosystem damit noch gewichtiger.

Übrigens: Die neue EU‑KI‑Verordnung kann erhebliche Folgen für Anbieter von KI‑Infrastruktur haben — von Dokumentationspflichten bis zu Kennzeichnungspflichten für hochriskante Systeme. Der gratis Leitfaden fasst die Pflichten kompakt zusammen, nennt Übergangsfristen und zeigt praxisnah, welche Schritte jetzt Priorität haben, damit Ihre KI‑Projekte compliant bleiben. Kostenloser Download für Entscheider in Unternehmen und Forschungseinrichtungen. KI‑Verordnung: Gratis‑Umsetzungsleitfaden herunterladen