Διαφήμιση
( 0 ψήφοι )

robot zΠώς λειτουργούν, λοιπόν, αυτά τα νευρωνικά δίκτυα που θα φέρουν τα ρομπότ δίπλα μας; Ενα τέτοιο δίκτυο ξεκινά με τη σάρωση μιας εικόνας από πολλά φίλτρα λογισμικού, τα οποία αναζητούν κάποια απλά χαρακτηριστικά της, ακριβώς όπως κάνουν τα κύτταρα του οπτικού φλοιού του εγκεφάλου. Η διαδικασία έχει ως αποτέλεσμα τη δημιουργία ορισμένων χαρτών χαρακτηριστικών -ένας για κάθε φίλτρο- οι οποίοι δείχνουν ποια κομμάτια της αρχικής εικόνας περιλαμβάνουν το ζητούμενο στοιχείο. Κάθε χάρτης μεταβάλλεται, ώστε να ενισχυθεί και να βελτιωθεί το κοντράστ του. Μετά, όλοι τους σαρώνονται εκ νέου μόνο που αυτή τη φορά, αντί τα προγράμματα να σταματούν σε κάθε πίξελ, το φίλτρο λαμβάνει μία φωτογραφία ανά αρκετά πίξελ. Ετσι παράγεται μία νέα ομάδα χαρτών με χαμηλότερη ανάλυση. Η διαδικασία επαναλαμβάνεται με αρκετές εκατοντάδες φίλτρα να ψάχνουν για όλο και πιο πολύπλοκα σχήματα. Το αποτέλεσμα όλης αυτής της δουλειάς είναι η δημιουργία αρκετά πολύπλοκων χαρτών των χαρακτηριστικών της εικόνας, οι οποίοι περνούν από τα τελικά φίλτρα. Αυτά κατατάσσουν τα αντικείμενα σε γενικές κατηγορίες, όπως π.χ. αυτοκίνητα ή πεζοί.

Η αποκρυπτογράφηση

Ο τεχνητός οπτικός φλοιός που δημιούργησε ο ΛεΚαν μπορεί να μάθει να αναγνωρίζει σωστά τα αντικείμενα τα οποία «βλέπει» και να μεταβάλλει τις δικές του παραμέτρους έτσι ώστε την επόμενη φορά που θα «αντικρίσει» παρόμοια εικόνα να μπορέσει να την αναγνωρίσει χωρίς πρόβλημα. Επειτα από αρκετές δοκιμές, αυτή η πολύπλοκα δομημένη τεχνητή όραση καταφέρνει να αναγνωρίσει τα γνωστά αντικείμενα σε εικόνες που δεν έχει αντικρίσει ποτέ.

Βέβαια, ακόμα και σε αυτή την περίπτωση, η όραση των ρομπότ απαιτεί ανθρώπινη χείρα βοηθείας. Στο επόμενο στάδιο το σύστημα βλέπει πολλές εικόνες χωρίς να λάβει πληροφορίες σχετικά με το τι ακριβώς απεικονίζουν, αλλά μπορεί να το καταλάβει.

Το CalTech 101, μία βάση δεδομένων που χρησιμοποιείται κατά κόρον στα πειράματα που έχουν να κάνουν με την αίσθηση της όρασης, περιλαμβάνει 10 χιλιάδες τυποποιημένες εικόνες, οι οποίες μπορούν να καταταχθούν σε 101 κατηγορίες με πολύπλοκα σχήματα, όπως παραδείγματος χάριν πρόσωπα, αυτοκίνητα και ρολόγια.

Με ακρίβεια 70%

Οταν ένα ConvNet (convolutional neural network) «κοιτάζει» εικόνες από τη συγκεκριμένη βάση δεδομένων, είναι δυνατόν να μάθει να αναγνωρίζει με ακρίβεια, που προσεγγίζει το 70%, τι είναι αυτό που βλέπει. Βέβαια, η ίδια προσέγγιση της «αυτοδιδασκαλίας του κομπιούτερ» δεν είναι ανάγκη να περιοριστεί αποκλειστικά σε θέματα ηλεκτρονικής όρασης. Θεωρητικώς είναι δυνατό να εφαρμοστεί και σε άλλα συστήματα με ανάλογη ιεραρχική δομή, όπως, παραδείγματος χάριν, είναι η επεξεργασία της γλώσσας.

Επί του παρόντος, το ConvNet κυριαρχεί στον συγκεκριμένο τομέα. Το Google το χρησιμοποιεί για να αφαιρέσει πρόσωπα και πινακίδες κυκλοφορίας από την εφαρμογή Streetview, η οποία έχει προκαλέσει πληθώρα αντιδράσεων σε πολλά κράτη. Τελευταία, για την τεχνολογία CovNet έχει αρχίσει να ενδιαφέρεται και η ερευνητική πτέρυγα του υπουργείου Αμυνας των ΗΠΑ, κάτι το οποίο δείχνει τις μεγάλες δυνατότητες που έχει.

CYBORGΤα ρομπότ αποκτούν... ανθρώπινη όραση

Πώς προσπαθούν οι επιστήμονες να «μεταφέρουν» τη δομή του οπτικού φλοιού στους ηλεκτρονικούς υπολογιστές

Τα ρομπότ γίνονται διαρκώς πιο έξυπνα και πιο επιδέξια. Σήμερα χρησιμοποιούνται ως πυροτεχνουργοί και καλούνται να αφοπλίσουν βόμβες, μπορούν να «πετάξουν» αεροσκάφη, να συναρμολογήσουν εξαιρετικά πολύπλοκες συσκευές ακόμα και να παίξουν ποδόσφαιρο. Δεν είναι λίγοι, λοιπόν, αυτοί που διερωτώνται γιατί δεν τα βλέπουμε δίπλα μας στον δρόμο και στο σπίτι, μακριά από τα μέτωπα του πολέμου, τις βιομηχανίες και τις διεθνείς εκθέσεις υψηλής τεχνολογίας.

Ενας λόγος είναι ότι η όρασή τους δεν είναι ιδιαίτερα καλή και ο κόσμος, βέβαια, φοβάται τις μηχανές που επειδή δεν μπορούν να δουν, μπορεί να προκαλέσουν ατύχημα οποιαδήποτε στιγμή.

Ενας ηλεκτρονικός υπολογιστής εξοπλισμένος με κάμερα, το μόνο που «βλέπει» είναι τα στοιχειώδη στοιχεία μιας φωτογραφίας, τα πίξελ. Ενα πίξελ δεν είναι παρά ένας αριθμός που αντικατοπτρίζει πόσο φως έχει «χτυπήσει» συγκεκριμένο σημείο κάποιου αισθητήρα. Οι ερευνητές που ασχολούνται με τον τομέα προσπαθούν να δημιουργήσουν έναν αλγόριθμο που θα μπορεί να αποκωδικοποιήσει αυτούς τους αριθμούς και να τους μεταφράσει ως «απεικονίσεις» αποτελούμενες από διαφορετικά αντικείμενα, μέσα σε συγκεκριμένο χώρο. Αυτό ακριβώς κάνει κάθε άνθρωπος που βλέπει, μέσα σε ελάχιστο χρόνο και χωρίς να καταβάλλει ιδιαίτερη προσπάθεια.

Είναι, ωστόσο, πολύ δύσκολο να κάνει το ίδιο ένας ηλεκτρονικός υπολογιστής.

Οταν ένα άνθρωπος βλέπει, η εικόνα ενός αντικειμένου μετά τον σχηματισμό της στον αμφιβληστροειδή, αποστέλλεται στο οπίσθιο μέρος του εγκεφάλου, στον οπτικό φλοιό, όπου γίνεται η επεξεργασία της. Τα πρώτα νευρικά κύτταρα από τα οποία περνά αντιδρούν μόνο σε κάποια, απλά ερεθίσματα, όπως είναι παραδείγματος χάρη, πλευρές που έχουν κλίση. Πυροδοτούν, ωστόσο, τη λειτουργία άλλων κυττάρων, σε μεγαλύτερο βάθος του οπτικού φλοιού, που αντιδρούν σε πιο πολύπλοκα, σύνθετα ερεθίσματα. Τα κύτταρα κάθε διαδοχικής περιοχής μπορούν να διακρίνουν όλο και πιο πολύπλοκα χαρακτηριστικά και αυτά που βρίσκονται στην κορυφή της ιεραρχικής πυραμίδας αντιδρούν σε γενικές κατηγορίες, π.χ. ζώα ή πρόσωπα. Κι όλη η διαδικασία δεν διαρκεί περισσότερο από ένα δέκατο του δευτερολέπτου.

Οι επιστήμονες γνωρίζαν επί πολλά χρόνια τη διαδικασία με την οποία βλέπει ο άνθρωπος. Στα τέλη του 1980, ο Γιαν ΛεΚάν, του Πανεπιστημίου της Νέας Υόρκης προσπάθησε να μιμηθεί αυτή την ιεραρχική δομή του οπτικού φλοιού και στους ηλεκτρονικούς υπολογιστές, δημιουργώντας τα λεγόμενα «συνελικτικά νευρωνικά δίκτυα» (ConvNets).

Θα μας «υπηρετούν» διαβάζοντας τη σκέψη μας

Ενα ρομπότ που βλέπει και αναγνωρίζει όπως ο άνθρωπος, θα αποτελέσει σημαντική εξέλιξη της Ρομποτικής. Ωστόσο, τα όνειρα των επιστημόνων δεν σταματούν εδώ. Ο Ρατσές Ράο και οι συνεργάτες του στο Πανεπιστήμιο της Ουάσιγκτον προσπαθούν να κατασκευάσουν ένα ρομπότ που όχι μόνο θα μας «υπηρετεί», αλλά θα το πράττει διαβάζοντας απλώς τη σκέψη μας. Η ομάδα του δρος Ράο στο Εργαστήριο Νευρωνικών Συστημάτων ήδη προγραμματίζει ένα ρομπότ ώστε να επιδεικνύει τη συγκεκριμένη συμπεριφορά που θα επιλέξουν οι χρήστες του μέσω μιας συσκευής ηλεκτροεγκεφαλογραφήματος που χαρτογραφεί την εγκεφαλική τους δραστηριότητα.

Αρχικός στόχος της ομάδας ήταν ο χρήστης να μπορεί να στείλει διά της σκέψεώς του εντολές στο ρομπότ, τις οποίες αυτό θα μετέφραζε σε κίνηση. Ωστόσο, αυτό απαιτεί να έχει προγραμματιστεί η πολύπλοκη συσκευή ώστε να μπορεί να επιδείξει κάποιες στοιχειώδεις συμπεριφορές, που σύμφωνα με τον δρα Ράο ήταν υπερβολικά περιορισμένες. Ετσι, λοιπόν, σκέφτηκε ότι εάν μπορούσαν να χαρίσουν στο ρομπότ την ικανότητα της μάθησης, θα μπορούσαν να προσεγγίσουν μεγαλύτερο φάσμα κινήσεων και αντιδράσεων. Γι’ αυτό τον λόγο προσπάθησαν να εκμεταλλευτούν την ιεραρχική δομή του εγκεφάλου μέσω της οποίας ελέγχεται το σώμα μας. «Ο εγκέφαλος είναι οργανωμένος σε διαδοχικά επίπεδα ελέγχου. Τα κυκλώματα στα χαμηλότερα επίπεδα φέρνουν σε πέρας κάποιες απλές συμπεριφορές, όπως το περπάτημα, ενώ τα ανώτερα επίπεδα, πιο πολύπλοκες».

Ο δρ Ράο και οι συνεργάτες του αναπτύσσουν μια ιεραρχημένη διαδραστική σχέση ανθρώπινου εγκεφάλου και ρομπότ, που τελικά θα ελέγχει το μηχάνημα.

mitraΟ Μίτρα

Το ρομπότ του δρος Ράο ονομάζεται Μίτρα, δηλαδή φίλος. Eχει ύψος δύο μέτρα και μπορεί να περπατήσει, να ψάξει για γνωστά αντικείμενα, να τα σηκώσει ή να τα ακουμπήσει σε προκαθορισμένο σημείο. Μάλιστα, τώρα οι ερευνητές φτιάχνουν ένα σύστημα με το οποίο ο Μίτρα θα μπορεί να περπατά σε διαφορετικά σημεία μέσα σε ένα χώρο. Ενας από τους ερευνητές φορά το ειδικό ελαστικό κράνος τού ηλεκτροεγκεφαλογραφήματος (EEG) και εκπαιδεύει το ρομπότ να κάνει κάτι καινούργιο.

Οταν το ρομπότ «εκπαιδεύεται», χρησιμοποιούνται ειδικοί αλγόριθμοι για να χαρτογραφήσουν τις ενδείξεις του αισθητήρα που το ρομπότ λαμβάνει σε εντολές. Αν το ρομπότ καταφέρει να μάθει τη νέα δραστηριότητα, οι επιστήμονες ζητούν από το σύστημα να αποθηκεύσει τη νέα εντολή.

Το μεγαλύτερο πρόβλημα που αντιμετωπίζουν οι ερευνητές σήμερα είναι η έλλειψη ακρίβειας του συστήματος. «Η μέθοδος μπορεί να διδάξει το ρομπότ απλά πράγματα, π.χ. να κινηθεί από το σημείο Α στο σημείο Β, αλλά όχι πιο πολύπλοκα καθήκοντα, όπως π.χ. να ανοίξει ένα μπουκάλι με χάπια ή να δέσει κορδόνια» εξηγεί ο δρ Ράο.

Δεν κινδυνεύει να πέσει πάνω μας

Η αρμόδια υπηρεσία του υπουργείου Αμυνας των ΗΠΑ έδωσε στον δρα ΛεΚάν ένα μικρό ρομπότ το οποίο, αφού εφοδιάστηκε με το σύστημα τεχνητής όρασης ConvNet, έμαθε να αναγνωρίζει μεγάλα αντικείμενα από μεγάλη απόσταση και να διορθώνει κατά τέτοιο τρόπο την πορεία του μέσα στον χώρο ώστε να μην προσκρούει πάνω τους.

Αυτό το τόσο απλό αδυνατούν να το κάνουν τα λιγότερο εξελιγμένα ρομπότ. Το συγκεκριμένο ρομπότ, που έχει το μέγεθος μοτοποδήλατου, μπορεί να κινείται στον χώρο χωρίς να τσακίζεται πάνω στους ερευνητές. Μάλιστα, αυτοί αψηφώντας τους... κινδύνους και πάντα για το καλό της επιστήμης τους, κατά τη διάρκεια των πειραμάτων στάθηκαν μπροστά του, ενώ αυτό ερχόταν κατά πάνω τους με ταχύτητα.

Ετσι διαπίστωσαν ότι πραγματικά τους έβλεπε και σταματούσε ή οπισθοχωρούσε. Τέτοια ρομπότ, που βλέπουν και αναγνωρίζουν, μπορεί να μην είναι ακόμα έτοιμα να περπατήσουν δίπλα μας στον δρόμο, αλλά η ημέρα που θα γίνει και αυτό δεν θα αργήσει πολύ.

 

30/10/2010 - kathimerini.gr με πληροφορίες από The Economist

δημοψήφισμα

Νέα επικαιρότητας: Ποιότητα ή ποσότητα;