• NVIDIAs Strategie für Robotik ist ein ambitionierter Ansatz, der sich darauf konzentriert, zunächst die komplexeste Herausforderung zu lösen – die Entwicklung humanoider Roboter –, damit die daraus resultierenden Fortschritte in der KI-Technologie auf alle Bereiche der Robotik und autonomen Systeme übergreifen können.
  • NVIDIA bekennt sich dazu, ein Plattformanbieter zu sein, der die notwendige Infrastruktur bereitstellt, um das Wachstum des Robotik-Ökosystems für alle Partner zu beschleunigen, und verfolgt dabei eine Philosophie der Zusammenarbeit, die eine Abhängigkeit von einem einzelnen Anbieter vermeidet.
  • Die Entwicklung von Roboter-KI basiert auf der Architektur der „Drei Säulen“ – Training (DGX), Simulation (Omniverse) und Einsatz (Jetson) – wobei die leistungsstarke Softwareplattform CUDA des Unternehmens als Grundlage dient, die diesen gesamten geschlossenen Kreislaufprozess beschleunigt.

NVIDIA , ein Unternehmen, das für seine GPU-basierte KI-Beschleunigung bekannt ist, gestaltet die Zukunft der Robotik mit einer umfassenden, vielschichtigen Strategie, die Hardware-, Simulations- und Software-Ökosysteme einbezieht. Ein kürzlich geführtes Einzelinterview mit Spencer Huang, Produktlinienmanager für Robotik-Software bei NVIDIA, gab Einblicke in den Ansatz des Unternehmens. Die Philosophie dahinter: Zuerst die größten Herausforderungen anzugehen, ein offenes Ökosystem zu fördern und den nachhaltigen Wettbewerbsvorteil – die proprietäre CUDA-Technologie – optimal zu nutzen.

Die Herausforderung mit dem Humanoiden: Zuerst das schwierigste Problem lösen

NVIDIAs Ansatz in der Robotik ist strategisch kontraintuitiv, aber im Kern fundiert: Zuerst das schwierigste Problem lösen. Für NVIDIA ist dieses Problem der humanoide Roboter. Dies ist eine klassische „Moonshot“-Strategie. Ein universell einsetzbarer humanoider Roboter benötigt ein intelligentes System, um in der unstrukturierten, komplexen realen Welt nahtlos wahrzunehmen, zu denken und zu handeln. Die erforderlichen Fortschritte beim Training und der Inferenz von Bild-, Sprach- und Aktionsmodellen (VLA) sind so tiefgreifend, dass die daraus resultierende Technologie sich naturgemäß auf einfachere, eingeschränktere Robotikanwendungen wie Fabrikarme, Lagerlogistik und autonome Fahrzeuge übertragen lässt.

Dieses Konzept ist eng mit der übergeordneten Vision der „ Physischen KI “ verknüpft, die NVIDIA als die ultimative Verwirklichung von KI für alle Lebensbereiche bzw. Welt-KI ansieht. Es geht darum, Systeme zu entwickeln, die mit den physikalischen Gesetzen unserer Welt interagieren und diese verstehen können – und damit die digitale Welt hinter sich lassen und in die greifbare Realität vordringen.

Laut Counterpoint Research werden die Gesamteinnahmen aus humanoiden Robotern im Jahr 2030 16 Milliarden US-Dollar übersteigen, was einer durchschnittlichen jährlichen Wachstumsrate (CAGR) von 51 % zwischen 2024 und 2030 entspricht. China wird gemessen an den Liefermengen der größte Einzelmarkt bleiben, während Amerika ein enormes Potenzial für High-End-Produkte bietet und den Fachkräftemangel in der Automobil- und Halbleiterindustrie beheben kann. 2025 gilt als das erste Jahr der Kommerzialisierung humanoider Roboter, in dem diverse Produkte in die Massenproduktion gehen und in Fabriken und Unternehmen in kleinem Umfang eingesetzt werden. Die alternde Bevölkerung in den großen Volkswirtschaften der Welt wird künftig eine enorme Nachfrage nach flexiblen humanoiden Robotern erzeugen. Gleichzeitig werden spezielle humanoide Roboter entwickelt, um Menschen bei gefährlichen Arbeiten zu ersetzen oder mit ihnen bei Rettungseinsätzen oder in anderen spezifischen Umgebungen zusammenzuarbeiten.

Quelle: NVIDIA 

Der Plattformspieler: Keine Geiseln, nur Zusammenarbeit

Ein zentrales Thema des Interviews war NVIDIAs Bestreben, ein Plattformanbieter zu sein und eine Abhängigkeit von einem einzelnen Anbieter zu vermeiden.

Diese Philosophie ist im noch jungen und komplexen Feld der Robotik von entscheidender Bedeutung. Niemand möchte von einem einzigen Technologieanbieter abhängig sein. NVIDIA versteht, dass der Aufbau einer nachhaltigen und florierenden Branche die Bereitstellung der notwendigen Infrastruktur erfordert, die es allen Akteuren – von Startups bis hin zu Großunternehmen – ermöglicht, mit ihrem jeweiligen Fachwissen erfolgreich zu sein.

Die Branche ist noch zu jung und die Probleme zu vielfältig, als dass ein einzelnes Unternehmen sie dominieren könnte. NVIDIA erkennt an, dass andere Unternehmen über umfassendere und tiefgreifendere Expertise in bestimmten Bereichen verfügen. Das Bestehen konkurrierender Ökosysteme wird als Wettbewerbsnotwendigkeit betrachtet, da es sicherstellt, dass vielfältige und überlegene Lösungen gefunden und umfassend getestet werden. NVIDIAs Ziel ist klar: überlegene Werkzeuge bereitzustellen, um den Branchenfortschritt zu beschleunigen, nicht den Markt zu beherrschen.

Die drei Säulen der Technologie

Die technische Strategie von NVIDIA basiert auf dem Konzept der „Drei Computer“ – dem Trainingsserver (z. B. DGX), dem Simulationsserver (z. B. Omniverse) und dem Edge-Computer (z. B. Jetson). Diese Architektur spiegelt den geschlossenen Entwicklungszyklus moderner KI wider, der vom VLA-Modelltraining über die Erstellung von Trainingsdaten und die Feinabstimmung von Modellen für den lokalen Einsatz bis hin zur Entwicklung einer Komplettlösung für den Aufbau des Gehirns eines flexiblen humanoiden Roboters reicht.

1. Training (The DGX): KI-Modelle werden mithilfe großer Cluster entwickelt.

2. Simulation (Das Omniversum): Modelle werden in virtuellen Welten für spezifische Aufgaben oder Umgebungen getestet, validiert und verfeinert.

3. Einsatz (Die Jetsons): Die Modelle werden in der realen Welt auf spezialisierter Hardware ausgeführt.

Daten bleiben aufgrund der Datenknappheit die größte Herausforderung. Um diese zu bewältigen, verwendet NVIDIA eine Kombination aus realen und simulierten Daten. Paradoxerweise wird eine geringe Genauigkeit der simulierten Sensoren während der anfänglichen, umfangreichen Trainingsphase als akzeptabel angesehen, da das Ziel darin besteht, große Datenmengen schnell zu verarbeiten, um ein rasches Lernen zu ermöglichen. Je näher das Modell jedoch dem Einsatz in der Praxis kommt, desto höher muss die Genauigkeit der Wahrnehmung sein, um Sicherheit, Präzision und Robustheit zu gewährleisten.

Quelle: NVIDIA 

Der beständige Kern: Tiefer graben mit CUDA

Hinter dem offenen Ökosystem und den ambitionierten Zielen verbirgt sich NVIDIAs wahrer und nachhaltigster Wettbewerbsvorteil: die Software- und Parallelrechnerplattform CUDA.

Huangs Team hat sich zum Ziel gesetzt, Wissen und Technologien zu erwerben, die das aktuelle Verständnis der Kunden in Bezug auf tiefgreifende Branchenexpertise übertreffen. Das bedeutet, dass NVIDIA, obwohl sie auf Partner angewiesen sind, in bestimmten Bereichen mitunter tiefergehende Recherchen durchführen muss als ihre Partner, um ihre Plattform zu stärken. Das in diesen intensiven Analysen gewonnene Wissen dient nicht dem Wettbewerb mit Partnern, sondern der Optimierung der Kerninfrastruktur, wodurch jeder Partner einen entscheidenden Leistungsschub erhält.

Hier entfaltet CUDA seine ganze Magie. Die Möglichkeit, den gesamten Stack – von der GPU-Architektur (Hardware) bis zum Parallelverarbeitungs-Framework (CUDA und seine Bibliotheken) – zu steuern und zu optimieren, ermöglicht es NVIDIA, KI-Workloads weit über die Möglichkeiten der Konkurrenz hinaus zu beschleunigen. CUDA bleibt die Kernkompetenz, die es Kunden ermöglicht, in ihren jeweiligen Fachgebieten fortschrittlichere Produkte zu entwickeln.

Die Roadmap ist ambitioniert: die Entwicklung humanoider Roboter ermöglichen, die Plattform bereitstellen und die gesamte Branche mithilfe der enormen Leistung optimierter GPU-Computing-Technologien beschleunigen. Der Markt für humanoide Roboter, der derzeit durch Kosteneffizienz eingeschränkt ist, dürfte nach Erreichen der Industrialisierung und Skalierung – angetrieben durch NVIDIAs Basistechnologien – einen Boom erleben und damit die historische Entwicklung des Automobilmarktes widerspiegeln.

Visited 3 times, 1 visit(s) today