Tip:
Highlight text to annotate it
X
Folgen Sie uns mit InsideScience
und werfen Sie den Forschern einen Blick über die Schulter.
Martin Lösch und Rainer Jäckel erforschen am Karlsruher Institut für Technologie
wie man Roboter durch Vormachen einer Handlung programmieren kann.
Hallo, wir beschäftigen uns hier damit,
wie der Roboter lernen kann,
speziell mit der Frage
„Kann ein Roboter durch Vormachen lernen?",
wie das auch Menschen tun.
Normalerweise werden Roboter programmiert,
Menschen nicht.
Sondern bei Menschen,
speziell bei Kindern ist das so, wenn die etwas nicht können,
aber lernen sollen wie das funktioniert,
dann macht das ein Erwachsener vor.
Das kann zum Beispiel so aussehen.
Ich habe einen Erwachsenen,
der vielleicht einem Kind zeigen möchte,
wie kann ich ein Getränk einschenken in ein Glas.
So, ungefähr.
Und während er das vormacht,
damit das Kind auch überhaupt was lernen kann,
muss es natürlich zuschauen.
Das heißt wir haben auch ein Kind,
das dabei steht und sich das Ganze anguckt.
Und wenn das Kind das ein,
zwei Mal gesehen hat,
dann kann es hoffentlich auch ein Getränk einschenken.
Was wir jetzt gerne hätten, wäre,
dass der Roboter das auch so lernen kann.
Das heißt, statt einem Kind
würden wir hier gerne einen Roboter hinstellen,
der sich das Ganze anguckt,
der kann ungefähr so aussehen,
der guckt sich das an
und soll dann daraus lernen,
wie schenke ich ein Getränk ein.
Jetzt ist natürlich die Frage,
was ist dabei das Problem.
Was man auf jeden Fall heute
auch schon machen kann, ist,
ich kann beobachten und aufzeichnen,
wo der Mensch seine Hände hinbewegt
und kann das auf den Roboter einfach abspielen.
Das heißt,
wenn ich mir das etwas genauer angucke,
habe ich hier einen Becher.
Ich habe hier irgendwo eine Flasche.
Ich habe hier irgendwo natürlich
auch Hände an den Gegenstände.
So zum Beispiel hier und hier
und wenn ich das jetzt halte, als Mensch,
dann würde ich das kippen
und gieße dabei ein Getränk in den Becher.
Wenn ich das einfach auf den Roboter abspiele
und der ähnlich wie ein Mensch ist,
dann kann er auch mit genau mit diesem Becher
und genau dieser Flasche,
ebenfalls ein Getränk einschenken.
Das ist aber eigentlich nicht genug,
weil was das Kind dabei lernt,
wenn es das beobachtet,
ist nicht nur für diese Flasche
und für diesen Becher,
wie es etwas einschenken kann,
sondern ein Kind könnte dann
auch einen anderen Becher
und eine andere Flasche nehmen.
Es hat nicht jeder den gleichen Becher
und die gleiche Flasche daheim,
das heißt, es könnte auch passieren,
ich habe hier einen etwas kleineren Becher,
aber dafür, damit sich das wieder ausgleicht,
eine etwas größere Flasche.
Und wenn ich jetzt einfach meine Hände
wieder an die gleiche Stelle bewege,
wie ich das vorher gemacht habe
und jetzt anfange zu schütten,
werde ich überall eingießen,
aber ziemlich sicher nicht in meinem Becher.
Das heißt, was der Roboter eigentlich tun soll,
ist nicht nur aufzeichnen
und das Ganze wieder abspielen,
sondern eigentlich soll er dabei lernen
und auch verallgemeinern über die Gegenstände hinaus,
sodass er aus dem Beobachten
von nur einigen wenigen Demonstrationen,
mit zwei bestimmten Gegenständen,
möglichst für viele andere Gegenstände,
das auch durchführen kann.
So wie ein Mensch das auch kann.
Und wie das im Detail funktioniert,
das zeigt euch jetzt mein Kollege.
Hallo, Martin hat euch gerade erklärt,
wie Programmieren durch Vormachen funktioniert.
Ich werde euch das jetzt
anhand eines Beispiels näher erklären.
Wir sind hier in unserem PDV-Labor.
Wir haben hier verschiedene Sensorsysteme,
um den Menschen zu beobachten.
Zum Beispiel haben wir Magnetfeldsensoren,
mit denen wir die Positionen
der Hände im Raum bestimmen können.
Wir haben Datenhandschuhe,
mit denen man die Gelenkwinkel
der menschlichen Hand wahrnehmen kann.
Zusätzlich gibt es noch Kamerasysteme,
mit denen wir die Objekte,
die sich auf dem Tisch befinden, wahrnehmen,
oder auch wie sich Objekte bewegen können.
Solche Kamerasysteme
sind hier im ganzen Raum verteilt,
sodass wir möglichst viele verschiedene
Ansichten bekommen.
Wenn wir jetzt eine Handlung lernen möchten,
wie zum Beispiel das Einschenken,
dann macht der Mensch mehrere Vorführungen davon.
Meistens sind es um die zehn Stück.
Das heißt, ich greife hier jetzt den Becher
und die Flasche und schenke damit ein.
Von diesen Vorführungen, wie gesagt,
macht man ungefähr zehn Stück.
Und darauf basierend,
wird jetzt ein initiales Model gelernt,
das eben dann mehrere,
verschiedene Handlungsmöglichkeiten abbildet,
die der Roboter hat,
um die gleiche Handlung durchzuführen.
Aber wo wir hinwollen, ist,
dass der Roboter nicht nur
mit diesen Gegenständen,
sondern auch mit anderen Gegenständen,
wie zum Beispiel einem Messbecher
umgehen können soll,
oder eben wenn der Becher
sich im Schrank befindet
und nicht nur auf dem Tisch steht.
Dazu müssen wir noch
weitere Demonstrationen machen
zum Beispiel komplexere Vorführungen.
Wir bewegen die Flasche von hinten
und schenken damit ein.
Basierend auf solchen Vorführungen,
kann das Wissen weiter verfeinert werden
und dem Roboter ist es nun möglich,
dass er mit Gegenständen einschenkt,
die sich an beliebigen Positionen
auf dem Tisch befinden.
Was noch nicht funktioniert, ist,
dass der Roboter mit anderen Gegenständen einschenken kann,
wie mit unserem Messbecher zum Beispiel.
Und um das umzusetzen
gibt es ein automatisches Verfahren,
das heißt der Roboter versucht selbst,
indem er mehrere Möglichkeiten durchführte,
die Handlungsalternative zu finden,
mit der er dann eben mit diesen Gegenständen
das Einschenken durchführen kann.
Man sieht, dass der Roboter
sehr viele verschiedene Möglichkeiten
durchprobieren muss.
Das Ganze passiert natürlich im Roboter drin,
das heißt, davon bekommen wir nichts mit.
Und am Ende erhalten wir ein Modell der Handlung,
das stark vereinfacht ist.
Um mit diesem sehr verallgemeinerten Modell,
wie es Martin Lösch genannt hat,
sind wir nun in der Lage,
auch mit anderen Gegenständen
einzuschenken zu können,
zum Beispiel mit unserem Becher,
der im Schrank steht
oder eben auch mit unserem Messbecher.
Und das sehen wir jetzt hier im Video,
das heißt, der Roboter versucht mehrere Alternativen durch,
wie er den Becher greifen kann,
zum Beispiel von vorne oder von der Seite.
Das Ganze macht er auch mit dem Messbecher
und wir sehen auch,
dass der Roboter den Becher
an verschiedenen Positionen vor seinem Körper positionieren will.
Alle diese verschiedenen Möglichkeiten
geht der Roboter intern durch
und sucht sich die aus,
die genau die Richtige für diese Situation ist.
Und wie man sieht,
am Ende ist der Roboter in der Lage,
die Gegenstände zu greifen
und damit auch erfolgreich einzuschenken.
Was wir jetzt hier gesehen haben, ist,
dass der Roboter von einem Menschen lernt,
wie man einschenken soll.
Und zusätzlich kann er das Ganze
nicht nur mit den Gegenständen,
die wir hier benutzt haben,
sondern auch mit neuen Gegenständen.
Auch wenn diese Gegenstände
nicht auf dem Tisch stehen,
sondern sich vielleicht im Schrank befinden.
Und diese Verallgemeinerung
ist genau der Kern vom Programmieren durch Vormachen.
Wir können heute schon einfachere
oder auch schon komplexere Handlungen lernen,
indem wir sie hier im Trainingscenter beobachten,
aber das ist natürlich noch nicht die Erfüllung der Vision,
die wir hatten,
dass der Roboter wie ein Mensch
durch Demonstrationen lernen können soll.
Zunächst muss der Roboter lernen,
auch komplexere Objekte als nur Becher
und Flaschen zu benutzen,
zum Beispiel eine Kaffeemaschine mit mehreren Knöpfen.
Darüber hinaus sind heute
sehr viele Demonstrationen notwendig.
Es war die Rede von zehn oder mehr Handlungen,
die demonstriert werden müssen.
Ein Mensch kann schon aus zwei
oder drei Demonstrationen lernen.
Und schließlich ist das Trainingscenter,
wie wir es hier sehen,
mit den ganzen Sensoren,
zwar ganz gut brauchbar für die Forschung
und für das Verständnis des Problems,
aber wenn wirklich Roboter in Wohnungen
bei Menschen zu Hause sind,
kann nicht jeder ein Trainingscenter haben.
Das heißt, dann wird es auch notwendig sein,
dass der Roboter wie der Mensch nur mit seinen Sensoren,
also zwei Kameras,
Handlungen beobachten und daraus lernen kann.
Das sind die Forschungsziele für die nächsten Jahre.
Die KIT-Serie InsideSience blickt den Wissenschaftlern
des Sonderforschungsbereichs über die Schulter.
Sehen Sie in weiteren Beiträgen,
wie ein Roboter konstruiert wird,
wie er lernt,
wie er mit Menschen interagiert
und welche gesellschaftlichen Aspekte diskutiert werden.