NVIDIA und Ineffable Intelligence bauen die Zukunft der Reinforcement-Learning-Infrastruktur

NVIDIA und das Londoner KI-Labor Ineffable Intelligence starten eine strategische Technologiepartnerschaft. Ziel ist der Aufbau einer leistungsfähigen Infrastruktur für groß angelegtes Reinforcement Learning. Damit soll die nächste Generation künstlicher Intelligenz ermöglicht werden, die kontinuierlich aus Erfahrung lernt und eigenständig neues Wissen generiert.

Von menschlichem Wissen zur autonomen Entdeckung

Die Forschung steht nach Ansicht von David Silver vor einem Paradigmenwechsel. Der AlphaGo-Architekt und Gründer von Ineffable Intelligence erklärt, dass die einfachere Aufgabe der KI weitgehend gelöst sei. Systeme zu bauen, die alles Wissen der Menschheit reproduzieren, reiche nicht mehr aus. Die nächste Herausforderung liegt darin, Agenten zu entwickeln, die eigenständig neues Wissen entdecken.

Dieser Ansatz erfordert ein fundamentales Umdenken. Statt auf statische Datensätze menschlicher Inhalte zurückzugreifen, müssen KI-Systeme durch Trial and Error in Echtzeit lernen. Sie agieren, beobachten ihre Umgebung, bewerten Ergebnisse und passen ihr Verhalten in geschlossenen Schleifen an. Diese Dynamik stellt die Hardware vor ganz neue Anforderungen.

Die technischen Herausforderungen des Reinforcement Learning

Im Gegensatz zum klassischen Pretraining fließen bei Reinforcement Learning keine festen Datensätze durch das System. Die Daten entstehen während des Trainingsprozesses selbst. Das erzeugt eine immense Last auf Interconnects, Speicherbandbreite und Serving-Infrastrukturen.

Jensen Huang, CEO von NVIDIA, betont die Bedeutung dieser Partnerschaft. Die nächste Grenze der KI seien sogenannte Superlearner, die fortlaufend aus Erfahrung lernen. NVIDIA wolle gemeinsam mit Ineffable Intelligence die Infrastruktur für diesen massiven Lernprozess entwerfen.

Darüber hinaus werden die Trainingsdaten künftig deutlich komplexer sein als menschliche Sprache. Neue Modellarchitekturen und spezialisierte Trainingsalgorithmen werden nötig, um diese vielfältigen Erfahrungsformen zu verarbeiten.

Grace Blackwell und Vera Rubin als Grundstein

Die gemeinsame Arbeit startet auf der NVIDIA Grace Blackwell-Plattform. Zugleich gehört das Projekt zu den ersten Anwendungen, die die kommende NVIDIA Vera Rubin-Architektur erproben. Ingenieure beider Unternehmen entwickeln gezielt eine Pipeline, die Reinforcement-Learning-Agenten in großem Maßstab mit Rechenleistung versorgt.

Das Ziel ist es, die nächste Generation von Hard- und Software zu definieren. Denn die KI-Welt bewegt sich zunehmend weg von reinen Human-Data-Modellen hin zu Agenten, die durch Simulation und Erfahrung lernen.

Fazit: Infrastruktur als Schlüssel zum Durchbruch

Die richtige Infrastruktur wird entscheidend sein, um Reinforcement Learning in hochkomplexen und reichhaltigen Umgebungen zu skalieren. Erst dadurch können Agenten systematisch Durchbrüche in allen Wissensbereichen erzielen.

Diese Kooperation markiert einen wichtigen Schritt hin zu einer neuen Ära künstlicher Intelligenz, in der Maschinen nicht nur Wissen reproduzieren, sondern eigenständig Neuland erschließen.

Quelle: NVIDIA Blog