Εμβόλιμα Νέα: Ρομπότ μαθαίνουν σε ρομπότ το πακ μαν

Με αφορμή την επιστημονική δημοσίευση για ρομπότ που διδάσκουν ρομπότ πώς να παίζουν ηλεκτρονικά παιχνίδια, ο υποψήφιος διδάκτορας του τμήματος Πληροφορικής του ΑΠΘ Ανέστης Φαχαντίδης μιλά στη “Μ” για την εμπειρία της “διδασκαλίας” μεταξύ μηχανών και προγραμμάτων, τη σημασία της μεταφοράς μάθησης στην οικιακή ρομποτική, την πληροφορία και το “θόρυβο” που φέρνει στη ζωή μας η τεχνολογία.

Της Μαρίας Τερζούδη

Ένα πρόγραμμα ή ένα ρομπότ αναλαμβάνει ρόλο δασκάλου και ένα άλλο ρόλο μαθητή. Παίζουν πακ μαν και Star Craft, δίνουν και ακολουθούν συμβουλές αντίστοιχα και το αποτέλεσμα είναι τόσο καλό, ώστε ο μαθητής ενδέχεται να κερδίσει το δάσκαλο. Ο κ. Φαχαντίδης εξηγεί τη διαδικασία με σαφήνεια: “Στη συγκεκριμένη δημοσίευση συνεργαστήκαμε με το πανεπιστήμιο της Ουάσιγκτον και ασχοληθήκαμε με πράκτορες, με οντότητες λογισμικού, που μπορούν να διδάξουν η μία την άλλη. Με αφορμή το παιχνίδι πακ μαν επιχειρήσαμε να επιδείξουμε τη δυνατότητα, με βάση τους αλγόριθμους και τις μεθόδους που προτείνουμε, να διδάσκει ένας υπολογιστής έναν άλλον τις ενέργειες που απαιτούνται, ώστε να πετύχει έναν σκοπό. Μπορούμε λοιπόν να εκπαιδεύσουμε ένα πρόγραμμα να παίζει ‘πακ μαν’ και να πηγαίνει πολύ καλά και ταυτόχρονα κάποιο άλλο πρόγραμμα, το οποίο δεν έχει εκπαιδευτεί, να μαθαίνει, να δέχεται συμβουλές”. Στόχος της έρευνας είναι να έχουμε στο μέλλον συσκευές ή προγράμματα τα οποία εκπαιδεύονται, και όταν έρθει η ώρα να αντικατασταθούν, δεν θα χρειάζεται να εκπαιδευτούν από την αρχή. “Εξελίσσοντας τη δουλειά μας, προχωρούμε και σε διδασκαλία ανθρώπων μαθητών -έρευνα σε δείγμα 30 φοιτητών του πανεπιστημίου της Ουάσιγκτον έδειξε ότι βελτίωσαν το παιχνίδι τους στο πακ μαν βάσει συμβουλών που δέχονταν από το πρόγραμμα. Έτσι προκύπτουν αλγόριθμοι διδασκαλίας: Ο υπολογιστής διδάσκει, μεταφέρει τη γνώση του, τη μάθησή του σε άλλους υπολογιστές, προγράμματα, ρομπότ ή ανθρώπους”.

Μεταφορά γνώσης, ενισχυτική μάθηση και έξυπνες συσκευές

Στο άμεσο μέλλον περιμένουμε πολύ περισσότερες συσκευές που να εκπαιδεύονται βάσει προτιμήσεων, να προσαρμόζονται σε προσωπικές ανάγκες, να προβλέπουν την ανθρώπινη παρουσία στο χώρο, πότε χρειαζόμαστε κάτι, π.χ. τις αλλαγές θερμοκρασίας που θέλουμε σε έναν χώρο. Σε αυτή τη νέα γενιά συσκευών θα αποκτήσει μεγάλη σημασία η δυνατότητα να μεταφέρεται η γνώση, όταν αλλάζουμε συσκευή ή χώρο. “Η ερευνητική μου δουλειά εστιάζει στη μεταφορά μάθησης μεταξύ ανόμοιων συσκευών ή προγραμμάτων”, εξηγεί ο κ. Φαχαντίδης. “Για παράδειγμα μπορούμε να φανταστούμε έναν θερμοστάτη, ο οποίος ελέγχει μία μονάδα φυσικού αερίου. Ταυτόχρονα σε ένα άλλο σπίτι μπορεί να έχουμε κάποιον άλλο θερμοστάτη, ο οποίος ελέγχει την ψύξη ή έναν καυστήρα πετρελαίου. Παρότι οι εγκαταστάσεις είναι ανόμοιες, θέλουμε να μεταφέρουμε μάθηση από τη μία στην άλλη. Χαρακτηριστικό είναι και το παράδειγμα με το ρομποτάκι I-Cub και τα πειράματα που κάναμε στο εργαστήριο ρομποτικής του πανεπιστημίου του Πλίμουθ. Το ανθρωποειδές ρομπότ μαθαίνει κάποιες απλές κινήσεις, και αν θέλουμε να μεταφέρουμε τη γνώση σε ένα διαφορετικό ρομποτάκι, εφαρμόζουμε αλγόριθμους μεταφοράς μάθησης. Σε δικά μου πειράματα πετύχαινε να χτυπά μία μπάλα χρησιμοποιώντας το χέρι του και στη συνέχεια μεταφέραμε αυτή τη γνώση, ώστε να τη χτυπά χρησιμοποιώντας μόνον τη μέση και όχι το χέρι του. Η γνώση μεταφέρθηκε και αντιστοιχήθηκε αυτόματα μεταξύ των αρθρώσεών του και έμαθε πολύ πιο γρήγορα. Άλλο ένα παράδειγμα αποτελεί η ερευνητική δουλειά μας με τα προσαρμοστικά δρομολόγια για οργανισμούς αστικών συγκοινωνιών -ένα ερευνητικό πρόγραμμα του εργαστηρίου Μηχανικής Μάθησης και Ανακάλυψης Γνώσης του ΑΠΘ με διευθυντή και επιβλέποντα της διατριβής μου τον καθηγητή Ιωάννη Βλαχάβα. Το συγκεκριμένο πρόγραμμα θα ολοκληρωθεί τον προσεχή Ιούνιο. Με τους αλγόριθμους ενισχυτικής μάθησης πέρα από την πρόβλεψη της επιβατικής ζήτησης παρέχεται η δυνατότητα πειραματικά να προτείνεται και να σχεδιάζεται ένα ιδανικό δρομολόγιο.

“Αν θέλαμε λοιπόν να μεταφέρουμε το πρόγραμμα για έναν οργανισμό συγκοινωνιών σε μία άλλη πόλη, θα απαιτούταν σημαντικά λιγότερη επανεκπαίδευση. Όλο αυτό το πειραματικό πεδίο έχει στόχο επίσης την προσαρμογή των οικιακών συσκευών στις ανάγκες μας και συνδέεται με τη σημαντική τάση του Internet of Things και την επικοινωνία όλων των συσκευών μεταξύ τους”. Τα συστήματα ενισχυτικής μάθησης θυμίζουν την εκπαίδευση ενός κατοικίδιου σκύλου. Εκπαιδεύονται με ανταμοιβή και τιμωρία, με επιβράβευση και αποδοκιμασία. “Για παράδειγμα δηλώνουμε στο σύστημα αν η θερμοκρασία που προέβλεψε ένας έξυπνος θερμοστάτης όπου έχουμε ενισχυτική μάθηση είναι κατάλληλη και δηλώνουμε τη δυσαρέσκεια ή την ευαρέσκειά μας. Οι αλγόριθμοι παίρνουν αυτήν την επιβράβευση ή την αποδοκιμασία και τη μεταφράζουν σε αλλαγή πολιτικής. Το πρόβλημα είναι ότι χρειάζονται πολλές προσπάθειες και δοκιμές ειδικά στον οικιακό χώρο με μεγάλο κόστος -οικονομικό και χρονικό. Οπότε μία σημαντική ευκαιρία και για την οικιακή ρομποτική -η οποία δεν έχει εξελιχθεί όσο η βιομηχανική ρομποτική- είναι η μεταφορά μάθησης, το να αξιοποιηθεί ήδη υπάρχουσα γνώση. Με τη μηχανική μάθηση ο άνθρωπος δεν χρειάζεται να προγραμματίσει ο ίδιος τις συσκευές του, ενώ με την ενισχυτική μάθηση δεν θα χρειάζεται να επαναπρογραμματίσει τις συσκευές αυτές. Το ευρύτερο πεδίο, η διά βίου μηχανική μάθηση (Lifelong machine learning) αποτελεί hot topic για το προσεχές μέλλον”.

Ρομπότ εξυπνότερα από τον άνθρωπο

Πόσο κοντά βρισκόμαστε σε ένα σύστημα που θα διδάσκει για παράδειγμα μαθηματικά σε παιδιά; Θα φτάσουμε σύντομα στην κατασκευή προγραμμάτων και ρομπότ που θα είναι εξυπνότερα από τον άνθρωπο; “Η διδακτική ανώτερων αντικειμένων βασίζεται σε σημαντικό βαθμό και στη συναισθηματική αντιληπτικότητα του δασκάλου και εκεί ο άνθρωπος δεν μπορεί να συγκριθεί με κανένα σύστημα”, απαντά ο κ. Φαχαντίδης. “Υπάρχει ένα ολόκληρο νέο ερευνητικό πεδίο, αλλά δεν έχουμε φτάσει ακόμη στη διδασκαλία αντικειμένων σε ένα ανώτερο επίπεδο. Όταν η διαδικασία της μάθησης αφορά μία δεξιότητα, οπότε η σημασία του συναισθήματος μπορεί να μην είναι τόσο σημαντική, η αντίληψη ενός συστήματος μπορεί να είναι επαρκής. Όσο για την ευφυία, πρόκειται για πολύ λεπτό θέμα. Τι θα πει έξυπνο καταρχήν; Ένα κουνέλι είναι πιο έξυπνο από τον άνθρωπο στο να σκάβει τρύπες. Οι άνθρωποι κάνουμε συχνά το λάθος να κρίνουμε την ευφυία ανθρωπομορφικά, δηλαδή εντοπίζουμε ευφυή συμπεριφορά στη φύση ή την τεχνολογία, όπου παρατηρούμε παρόμοια συμπεριφορά με τη δική μας, παραβλέποντας τη διαφορετικότητα των στόχων, των μέσων αλλά και της αντιληπτικότητας μεταξύ των έμβιων οργανισμών, του ανθρώπου αλλά και των τεχνολογικών συστημάτων. Η ευφυία με αυτή τη συμπεριφορική έννοια είναι σχετική και πολυδιάστατη, δεν μπορεί να συγκριθεί. Οπότε πείτε μου την εργασία, το σκοπό αλλά και τα μέσα και θα ορίσουμε την ευφυία αναλόγως. Όταν λοιπόν η εργασία αφορά δεξιότητες, μία μηχανική δουλειά ή την επίλυση σαφώς ορισμένων προβλημάτων, ναι, η τεχνητή νοημοσύνη δίνει εδώ και χρόνια καλύτερες και ανώτερες λύσεις από αυτές που δίνει ο άνθρωπος. Αλλά η ευφυία -συμπεριλαμβανομένης της συναισθηματικής ευφυίας με την έννοια της πρωτοβουλίας, της δημιουργικότητας, της καινοτομίας, δεν είναι κάτι στο οποίο περιμένουμε να ξεπεραστεί ο άνθρωπος. Ο άνθρωπος δεν μπορεί να περιμένει ότι θα αντικατασταθεί για παράδειγμα, όσο ο ίδιος δεν κάνει τις δουλειές του ‘ρομποτικά’, όσο ο ίδιος δεν αφαιρεί τον ανθρώπινο παράγοντα από τις εργασίες του, από την ύπαρξή του”. Αναφερόμενος στο ευρύτερο πεδίο της ανάλυσης συναισθημάτων (sentiment analysis) τονίζει ότι όλα εξαρτώνται από δεδομένα που δίνει προς επεξεργασία ο άνθρωπος. “Για παράδειγμα στο στάτους στο facebook δηλώνουμε εκνευρισμένοι ή ευχαριστημένοι, δίνουμε δεδομένα για αντιστοίχηση κάποιων προτάσεων ή φράσεών μας με ένα συναίσθημα. Εκείνη τη στιγμή εκπαιδεύουμε οι ίδιοι ένα σύστημα που προχωρά σε αυτήν την αντίληψη. Ο άνθρωπος έχει τη δυνατότητα να καταλάβει το ανείπωτο, να μάθει από το αδήλωτο κι αυτό είναι το απαύγασμα, η κορύφωση της δυνατότητάς του στη μάθηση, μπορεί να μάθει να αντιλαμβάνεται ακόμη και πράγματα που δεν δηλώνονται και δεν υπάρχουν ως δεδομένα. Η τεχνητή νοημοσύνη και η μηχανική μάθηση θα αργήσουν πολύ, αν καταφέρουν ποτέ να φτάσουν σε αυτό το σημείο. Επιπλέον ο άνθρωπος έχει την πολυτέλεια να κάνει το ‘μη σκόπιμο’ αλλά το απλώς ευχάριστο, να ασχολείται με πράγματα που δεν έχουν άμεσα απόδοση και όφελος”.

Τι φέρνει το μέλλον;

Η ενισχυτική μάθηση σύμφωνα με τον κ. Φαχαντίδη μπορεί να εφαρμοστεί σε όλα τα προβλήματα στα οποία ο άνθρωπος δεν μπορεί να δώσει παραδείγματα σωστής λειτουργίας επακριβώς παρά μόνον επιβράβευση ή αποδοκιμασία. Τα συστήματα έχουν τη δυνατότητα να ψάχνουν λύσεις, τροχιές, που ο άνθρωπος δεν μπορεί να ανακαλύψει. “Παραδείγματα εφαρμογών ενισχυτικής μάθησης έχουμε στη διαχείριση κεφαλαίων, μετοχών στο χρηματιστήριο και πάνω από όλα στη ρομποτική. Τέλος περιμένουμε και ‘αντίστροφα’ αποτελέσματα: Σήμερα είμαστε σε θέση αυτό που λέμε cognitive science, γνωσιακή επιστήμη, να αξιοποιηθεί, ώστε από τον τρόπο με τον οποίο μαθαίνει ο υπολογιστής, ένα σύστημα, να ανακαλύψουμε τρόπους με τους οποίους μαθαίνει ένας άνθρωπος, παρότι τα μοντέλα που χρησιμοποιεί η τεχνητή νοημοσύνη είναι σε μεγάλο βαθμό απλοποιημένα. Πρόκειται για ερωτήματα προς διερεύνηση στο πεδίο και άλλων επιστημών, οπότε ο ‘διάλογος’ είναι ανοιχτός. Το εργαστήριο Μηχανικής Μάθησης και Ανακάλυψης Γνώσης του ΑΠΘ συμμετέχει με τις δύο ανοιχτές συνεργασίες -με το πανεπιστήμιο της Ουάσιγκτον στα ζητήματα της μάθησης και το πανεπιστήμιο του Πλίμουθ και το εργαστήριο ρομποτικής και γνωσιακής επιστήμης για τα κομμάτια της γνωσιακής επιστήμης”.

Αλληλεπίδραση, πληροφορία και “θόρυβος”

Σε αντίθεση με ό,τι ίσως θα περίμενε κανείς, δεν ασχολήθηκε ποτέ ιδιαίτερα με παιχνίδια στον υπολογιστή ούτε είναι φανατικός των social media. Για να ξεφύγει από την οθόνη, όπως λέει χαρακτηριστικά, τον τελευταίο καιρό ασχολείται με ηλεκτρονικά και, όσον αφορά την τεχνολογία, προσπαθεί να ξεχωρίζει την πληροφορία από το “θόρυβο” που τη συνοδεύει πάντα. Αυτό ωστόσο που εξακολουθεί να τον εντυπωσιάζει στη δουλειά του είναι το αποτέλεσμα και ο συνδυασμός των αλληλεπιδράσεων, “το πώς αναδύεται πολυπλοκότητα από απλά μέρη, πόσο γοητευτικό είναι να βλέπεις ένα σύστημα που αρχικά δεν επιτυγχάνει να μάθει, με μία μικρή αλλαγή παραμέτρων ή μερών -σαν να γεννιέται ζωή, να πετυχαίνει το φαινόμενο της μάθησης”.

Ετικέτες

Κυριακή 28 Δεκεμβρίου 2014

Ρομπότ μαθαίνουν σε ρομπότ το πακ μαν