Programmieren Durch Vormachen - Wie roboter von menschen lernen - De/en

Folgen Sie uns mit InsideScience und werfen Sie den Forschern einen Blick über die Schulter. Martin Lösch und Rainer Jäckel erforschen am Karlsruher Institut für Technologie wie man Roboter durch Vormachen einer Handlung programmieren kann. Hallo, wir beschäftigen uns hier damit, wie der Roboter lernen kann, speziell mit der Frage „Kann ein Roboter durch Vormachen lernen?", wie das auch Menschen tun. Normalerweise werden Roboter programmiert, Menschen nicht. Sondern bei Menschen, speziell bei Kindern ist das so, wenn die etwas nicht können, aber lernen sollen wie das funktioniert, dann macht das ein Erwachsener vor. Das kann zum Beispiel so aussehen. Ich habe einen Erwachsenen, der vielleicht einem Kind zeigen möchte, wie kann ich ein Getränk einschenken in ein Glas. So, ungefähr. Und während er das vormacht, damit das Kind auch überhaupt was lernen kann, muss es natürlich zuschauen. Das heißt wir haben auch ein Kind, das dabei steht und sich das Ganze anguckt. Und wenn das Kind das ein, zwei Mal gesehen hat, dann kann es hoffentlich auch ein Getränk einschenken. Was wir jetzt gerne hätten, wäre, dass der Roboter das auch so lernen kann. Das heißt, statt einem Kind würden wir hier gerne einen Roboter hinstellen, der sich das Ganze anguckt, der kann ungefähr so aussehen, der guckt sich das an und soll dann daraus lernen, wie schenke ich ein Getränk ein. Jetzt ist natürlich die Frage, was ist dabei das Problem. Was man auf jeden Fall heute auch schon machen kann, ist, ich kann beobachten und aufzeichnen, wo der Mensch seine Hände hinbewegt und kann das auf den Roboter einfach abspielen. Das heißt, wenn ich mir das etwas genauer angucke, habe ich hier einen Becher. Ich habe hier irgendwo eine Flasche. Ich habe hier irgendwo natürlich auch Hände an den Gegenstände. So zum Beispiel hier und hier und wenn ich das jetzt halte, als Mensch, dann würde ich das kippen und gieße dabei ein Getränk in den Becher. Wenn ich das einfach auf den Roboter abspiele und der ähnlich wie ein Mensch ist, dann kann er auch mit genau mit diesem Becher und genau dieser Flasche, ebenfalls ein Getränk einschenken. Das ist aber eigentlich nicht genug, weil was das Kind dabei lernt, wenn es das beobachtet, ist nicht nur für diese Flasche und für diesen Becher, wie es etwas einschenken kann, sondern ein Kind könnte dann auch einen anderen Becher und eine andere Flasche nehmen. Es hat nicht jeder den gleichen Becher und die gleiche Flasche daheim, das heißt, es könnte auch passieren, ich habe hier einen etwas kleineren Becher, aber dafür, damit sich das wieder ausgleicht, eine etwas größere Flasche. Und wenn ich jetzt einfach meine Hände wieder an die gleiche Stelle bewege, wie ich das vorher gemacht habe und jetzt anfange zu schütten, werde ich überall eingießen, aber ziemlich sicher nicht in meinem Becher. Das heißt, was der Roboter eigentlich tun soll, ist nicht nur aufzeichnen und das Ganze wieder abspielen, sondern eigentlich soll er dabei lernen und auch verallgemeinern über die Gegenstände hinaus, sodass er aus dem Beobachten von nur einigen wenigen Demonstrationen, mit zwei bestimmten Gegenständen, möglichst für viele andere Gegenstände, das auch durchführen kann. So wie ein Mensch das auch kann. Und wie das im Detail funktioniert, das zeigt euch jetzt mein Kollege. Hallo, Martin hat euch gerade erklärt, wie Programmieren durch Vormachen funktioniert. Ich werde euch das jetzt anhand eines Beispiels näher erklären. Wir sind hier in unserem PDV-Labor. Wir haben hier verschiedene Sensorsysteme, um den Menschen zu beobachten. Zum Beispiel haben wir Magnetfeldsensoren, mit denen wir die Positionen der Hände im Raum bestimmen können. Wir haben Datenhandschuhe, mit denen man die Gelenkwinkel der menschlichen Hand wahrnehmen kann. Zusätzlich gibt es noch Kamerasysteme, mit denen wir die Objekte, die sich auf dem Tisch befinden, wahrnehmen, oder auch wie sich Objekte bewegen können. Solche Kamerasysteme sind hier im ganzen Raum verteilt, sodass wir möglichst viele verschiedene Ansichten bekommen. Wenn wir jetzt eine Handlung lernen möchten, wie zum Beispiel das Einschenken, dann macht der Mensch mehrere Vorführungen davon. Meistens sind es um die zehn Stück. Das heißt, ich greife hier jetzt den Becher und die Flasche und schenke damit ein. Von diesen Vorführungen, wie gesagt, macht man ungefähr zehn Stück. Und darauf basierend, wird jetzt ein initiales Model gelernt, das eben dann mehrere, verschiedene Handlungsmöglichkeiten abbildet, die der Roboter hat, um die gleiche Handlung durchzuführen. Aber wo wir hinwollen, ist, dass der Roboter nicht nur mit diesen Gegenständen, sondern auch mit anderen Gegenständen, wie zum Beispiel einem Messbecher umgehen können soll, oder eben wenn der Becher sich im Schrank befindet und nicht nur auf dem Tisch steht. Dazu müssen wir noch weitere Demonstrationen machen zum Beispiel komplexere Vorführungen. Wir bewegen die Flasche von hinten und schenken damit ein. Basierend auf solchen Vorführungen, kann das Wissen weiter verfeinert werden und dem Roboter ist es nun möglich, dass er mit Gegenständen einschenkt, die sich an beliebigen Positionen auf dem Tisch befinden. Was noch nicht funktioniert, ist, dass der Roboter mit anderen Gegenständen einschenken kann, wie mit unserem Messbecher zum Beispiel. Und um das umzusetzen gibt es ein automatisches Verfahren, das heißt der Roboter versucht selbst, indem er mehrere Möglichkeiten durchführte, die Handlungsalternative zu finden, mit der er dann eben mit diesen Gegenständen das Einschenken durchführen kann. Man sieht, dass der Roboter sehr viele verschiedene Möglichkeiten durchprobieren muss. Das Ganze passiert natürlich im Roboter drin, das heißt, davon bekommen wir nichts mit. Und am Ende erhalten wir ein Modell der Handlung, das stark vereinfacht ist. Um mit diesem sehr verallgemeinerten Modell, wie es Martin Lösch genannt hat, sind wir nun in der Lage, auch mit anderen Gegenständen einzuschenken zu können, zum Beispiel mit unserem Becher, der im Schrank steht oder eben auch mit unserem Messbecher. Und das sehen wir jetzt hier im Video, das heißt, der Roboter versucht mehrere Alternativen durch, wie er den Becher greifen kann, zum Beispiel von vorne oder von der Seite. Das Ganze macht er auch mit dem Messbecher und wir sehen auch, dass der Roboter den Becher an verschiedenen Positionen vor seinem Körper positionieren will. Alle diese verschiedenen Möglichkeiten geht der Roboter intern durch und sucht sich die aus, die genau die Richtige für diese Situation ist. Und wie man sieht, am Ende ist der Roboter in der Lage, die Gegenstände zu greifen und damit auch erfolgreich einzuschenken. Was wir jetzt hier gesehen haben, ist, dass der Roboter von einem Menschen lernt, wie man einschenken soll. Und zusätzlich kann er das Ganze nicht nur mit den Gegenständen, die wir hier benutzt haben, sondern auch mit neuen Gegenständen. Auch wenn diese Gegenstände nicht auf dem Tisch stehen, sondern sich vielleicht im Schrank befinden. Und diese Verallgemeinerung ist genau der Kern vom Programmieren durch Vormachen. Wir können heute schon einfachere oder auch schon komplexere Handlungen lernen, indem wir sie hier im Trainingscenter beobachten, aber das ist natürlich noch nicht die Erfüllung der Vision, die wir hatten, dass der Roboter wie ein Mensch durch Demonstrationen lernen können soll. Zunächst muss der Roboter lernen, auch komplexere Objekte als nur Becher und Flaschen zu benutzen, zum Beispiel eine Kaffeemaschine mit mehreren Knöpfen. Darüber hinaus sind heute sehr viele Demonstrationen notwendig. Es war die Rede von zehn oder mehr Handlungen, die demonstriert werden müssen. Ein Mensch kann schon aus zwei oder drei Demonstrationen lernen. Und schließlich ist das Trainingscenter, wie wir es hier sehen, mit den ganzen Sensoren, zwar ganz gut brauchbar für die Forschung und für das Verständnis des Problems, aber wenn wirklich Roboter in Wohnungen bei Menschen zu Hause sind, kann nicht jeder ein Trainingscenter haben. Das heißt, dann wird es auch notwendig sein, dass der Roboter wie der Mensch nur mit seinen Sensoren, also zwei Kameras, Handlungen beobachten und daraus lernen kann. Das sind die Forschungsziele für die nächsten Jahre. Die KIT-Serie InsideSience blickt den Wissenschaftlern des Sonderforschungsbereichs über die Schulter. Sehen Sie in weiteren Beiträgen, wie ein Roboter konstruiert wird, wie er lernt, wie er mit Menschen interagiert und welche gesellschaftlichen Aspekte diskutiert werden.