Use Case
Erkunden, ergreifen, erforschen: Roboter für Einsätze auf anderen Planeten Allgemeines

Use Case im Überblick
Branche: Raumfahrt
Aufgabe: Greifen von (un-)bekannten Objekten bei Weltraummissionen
Methode: Grafische Methoden, Deep Learning, Normalizing Flow und weitere
Allgemeines
Weltraummissionen sind in hohem Maße von Robotern abhängig. Dies gilt insbesondere für die Erkundung von Planeten jenseits der Erde. Dabei sind häufig verschiedene Manipulationsaufgaben erforderlich, wie das Greifen bekannter (z. B. Werkzeuge, Messinstrumente) und unbekannter Objekte (z. B. Steine auf dem Mars) mit den Roboterarmen. Solche Arme können sowohl an mobilen Robotern (z. B. Rovern, Drohnen) als auch an stationären Systemen (z. B. Landefahrzeugen) angebracht sein.
Status quo
Roboter werden bei den meisten Weltraummissionen (z. B. Mars, Mond, ISS) heutzutage ferngesteuert: Bei Missionen mit kurzer Kommunikationsverzögerung (z. B. ISS) wird normalerweise ein Befehl gesendet und auf entsprechende Antwort gewartet. Ist die Verzögerung länger (z. B. Erde – Mars), wird eine Reihe von Befehlen gesendet, normalerweise für einen Tag. Für Aufgaben mit geringer Komplexität können derzeit in beiden Fällen begrenzt autonome Roboter eingesetzt werden, um zeitkritische Entscheidungen selbst zu treffen: beispielsweise zur Kollisionsvermeidung.
Das Greifen erfordert die Kombination von Handlungsabfolgen aus Aktorik und Sensorik bzw. Verfahren zur Objekterkennung. Für bekannte Objekte werden häufig vereinfachte Verfahren zur Lage- und Posenerkennung der Objekte verwendet: z. B. über Markierungen, Muster- und lernbasierte Ansätze. Lichtverhältnisse und Umgebungsbedingungen (z. B. Sensorrauschen etc.) stellen dabei größere Herausforderungen dar. Klassische Bilderkennungsverfahren, die auf Kantenerkennung, Schatten und/oder Tiefendaten basieren, stoßen unter den genannten Herausforderungen bei unbekannten Objekten jedoch an ihre Grenzen. Bei unterschiedlichen Umgebungen und Lichtverhältnissen sind Lernverfahren daher gegenüber klassischen Verfahren im Vorteil. Sie werden mit einer Vielzahl von Daten trainiert, um Objekte in unterschiedlichen Umgebungen zu erkennen. Wichtig ist dabei die Relevanz der Trainingsdaten für die jeweiligen Objekte und Umgebungen (Stichwort: Out-of-Distribution Error).
Zukunftsperspektiven mit KI
Lernbasierte Algorithmen bieten gerade im Bereich der Wahrnehmung enorme Möglichkeiten. Wünschenswert sind kontinuierlich Lernende Systeme, die auch mit unbekannten Daten zu Objekten, Oberflächen, physikalischem Verhalten etc. umgehen können. Hier wird in ferner Zukunft die Selbstbeobachtung von KI-Systemen eine große Rolle spielen. Allerdings sind solche Systeme derzeit noch nicht so ausgereift, dass man den introspektiven Werten vertrauen kann. Lernen durch Interaktion kann daher mittelfristig helfen, mit unbekannten Daten umzugehen, da durch Interaktion neue Lerndaten generiert werden: z. B. durch manuelle Datenannotation oder Teleoperation. Menschlicher Input, der beim Fernsteuern von Robotern entsteht, kann für das KI-Training genutzt werden, um beispielsweise Greifaktionen perspektivisch autonomer durchzuführen (Beyerer et al., 2021).
Quellen des Lernens
- Operatoren können eingehende Bilddaten unbekannter Objekte annotieren.
- Operatoren können das Robotiksystem via Teleoperation beim Greifen von Objekten fernsteuern.
- Das Robotiksystem kann autonom in Interaktion mit einem Objekt treten. Beispiel: ein unbekanntes Objekt, das als Stein erkannt wird, greifen und drehen, um so Bilder aus verschiedenen Blickwinkeln zu erstellen.
- Lernen durch Interaktion im Rahmen variabler Autonomie.
Benötigte Daten
- Daten aus dem Weltraum – die jedoch rar und knapp sind.
- Gründe dafür sind Einschränkungen bei der Signalübertragung und der Bandbreite, aber auch, dass nur einige wenige Missionen Daten vorgehalten haben.
- Zudem werden Daten aufgrund des hohen Formalismus im Weltraum oft nicht effizient zur Erde zurückgesendet, sondern über viele Relaispunkte (z. B. Satelliten, Empfangsstationen, Kontrollzentren etc.), wodurch die Nettodatenmenge nochmals stark reduziert wird.
- Die Leistungsfähigkeit Lernender Systeme hängt jedoch stark von gut annotierten und vielfältigen Trainingsdatensätzen ab. Neuere Forschungsansätze verwenden synthetisch generierte Daten, wobei hier nur Szenarien abgebildet werden können, die bekannt sind (Stichwort: simulation-to-reality-gap), was insbesondere bei anderen Himmelskörpern
nicht der Fall sein muss. - Daten aus der Mensch-Roboter-Interaktion können die Datenbasis erweitern (siehe Quellen des Lernens).
Methoden des Lernens
- Klassische Methoden des maschinellen Lernens: Grafische Modelle (z. B. Conditional Random Fields, CRF), Support Vector Machines (SVM), Gaussian Mixture Models (GMM), Clustering Ansätze oder Decision Trees.
- Modernere Methoden des maschinellen Lernens: Deep Learning, z. B. Multi-Layer Perceptrons (MLP), Convolutional Neural Networks (CNN) oder Transformer-Architekturen.
- Generative Lernansätze: Es ist wichtig, unbekannte Daten während der Missionsdurchführung sicher erkennen zu können (Stichwort: zuverlässige Selbstbeobachtung). Hierbei sind generative Lernansätze (z. B. Normalizing Flow), die auch Daten außerhalb der Trainingsdatenverteilung als solche erkennen, diskriminativen Ansätzen, die Daten immer einem der bekannten Kategorien zuordnen, vorzuziehen.
Generell sollten vor allem Lernstrategien eingesetzt werden, die operative Daten für das Training nutzen können. Neben Reinforcement, Continuous und Active Learning sind hier auch generative und evolutionäre Verfahren zu nennen.
Qualitätssicherung
Qualitätssicherung ist gerade in der Raumfahrt von großer Bedeutung. Für einen sicheren und zuverlässigen Einsatz lernbasierter Systeme ist grundlegend:
- Ein starker Fokus auf zuverlässige Selbsteinschätzungswerte der Methoden ist nötig (z. B. Konfidenz- und Plausibilitätswerte), um gegebenenfalls Anpassungen vorzunehmen.
- Darüber hinaus sollten bei der Objekterkennung Techniken der klassischen Computer Vision genutzt werden, um die Plausibilität der Einschätzung zu prüfen.
- Zusätzlich müssen allerdings auch Kontrollsysteme rund um lernbasierte Methoden entwickelt werden, um die nötige Sicherheit und Zuverlässigkeit zu gewährleisten.
Systemvoraussetzungen
- Die Schnittmengen hinsichtlich erforderlicher Fähigkeiten und Anforderungen zur Lösung von Greifaufgaben im Weltraum und in der Industrie sind groß, wobei der Einsatz im
Weltraum besonderen Voraussetzungen unterliegt. Obwohl die Umgebungen visuell sehr unterschiedlich sind, benötigen Robotersysteme in beiden Fällen Objekterkennung, Lage und Greifschätzung, Bahnplanung des Roboterarms und eine robuste Ausführung der Operation. - Daten aus Weltraummissionen und Interaktionen müssen aufgezeichnet und für maschinelle Lernverfahren zur Verfügung gestellt werden. Dazu müssen die Systeme neben den
für ihre Hauptaufgabe vorgesehenen Rechen- und Leistungsmöglichkeiten über Ressourcen verfügen, um Daten für das Lernen aufzuzeichnen, explizit neu zu berechnen
und in aufbereiteter Form zur Erde zu senden. Das Lernen mit diesen so gewonnenen Daten kann je nach Hardwareanforderung und Verfügbarkeit von Rechenkapazitäten
direkt auf dem Roboter stattfinden oder in geeigneten Einrichtungen wie Landefähre oder Kontrollzentrum. - Für den Einsatz von Lernverfahren direkt im Weltraum oder in der Nähe des Systems ist spezielle Hardware nötig (Stichwort: space-qualified GPU), die derzeit nicht verfügbar ist.
- Insbesondere das Lernen mit neuronalen Netzen wird aufgrund begrenzter Ressourcen (Kosten, Rechenkapazität usw.) wohl immer auf der Erde stattfinden. Daten müssen
daher in einer Form zur Erde gesendet werden, die auf dem Weg möglichst wenig Ressourcen blockiert und dennoch die nötige Qualität für das Lernen aufweist.
Weitere Voraussetzungen
Die Akzeptanz und auch die Bereitschaft, moderne KI-Technologien einzusetzen, ist insbesondere seitens der Programmleitung für derartige Missionen unabdingbar. Denn mit jedem Technologieexperiment muss auch eine Risikoübernahme einhergehen.
- Der Weltraum ist Gegenstand des internationalen (politischen) Wettbewerbs. Aus technischer Sicht und aufgrund der Tatsache, dass nur sehr wenige reale Daten zur Verfügung
stehen, ist internationale Zusammenarbeit hier jedoch von herausragender Bedeutung. - Zudem bergen Synergien zwischen Industrie und Raumfahrt beim Thema Erkennen und Greifen von Objekten Potenziale.
Realisierung und mögliche Hürden
Experimente, bei denen einem Mars-Rover mehr Rechenleistung durch leistungsfähigere Computer auf einem Mars-Hubschrauber zur Verfügung steht, stimmen Forschende sehr zuversichtlich, ebenso wie die Chancen, die kommerzielle Standardhardware bereits bietet. Sind domänenadäquate und leistungsfähigere Rechnerarchitekturen erst einmal verfügbar, werden Lernverfahren vermehrt eingesetzt – auch beim Greifen. Im nächsten Jahrzehnt wird sich dies in vielen, auch kommerziellen, (Mond-)Missionen zeigen, ebenso wie weitere Schritte hin zum Lernen in Iterationen im Weltraum.
(Einschätzung I Stand 09/2024)
Entwickelt wurde dieser Use Case mit Expertise aus der Arbeitsgruppe „Lernfähige Robotiksysteme“ der Plattform Lernende Systeme, insbesondere von Dr. Armin Wedler (Deutsches Zentrum für Luft- und Raumfahrt)
Quellen
Jürgen Beyerer et al. (Hrsg.) (2021): Kompetent im Einsatz – Variable Autonomie Lernender Systeme in lebensfeindlichen Umgebungen. Whitepaper aus der Plattform Lernende Systeme, München.