Ας φανταστούμε έναν υπολογιστή πάνω σε ρόδες, ο οποίος είναι εξοπλισμένος με κάμερα, μικρόφωνο, ηχεία, όργανα αφής και (ίσως και κάποια άλλα μετρητικά όργανα) τα οποία όλα λειτουργούν συνέχεια. Τα δεδομένα σε real time περνάνε από διάφορα layers εκμάθησης ώστε τελικά να αποθηκεύεται, για οτιδήποτε βλέπει, ακούει, και αισθάνεται με οποιοδήποτε τρόπο, μια "invariant" μορφή της πληροφορίας που απέκτησε.
Ταυτόχρονα, αυτό το σύστημα να είναι εξοπλισμένο με σύστημα "συναισθημάτων". Στο παρελθόν έχουν παρουσιασθει διάφορα τέτοια τεχνητά συστήματα "συναισθημάτων", αλλά κανένα δεν έχει εφαρμοσθεί σε τέτοια μεγάλη κλίμακα.
Αυτό που υποστηρίζει ο φίλος μας ο jeff hawkins, ότι δηλαδή δε χρειάζεται επιπλέον υπολογιστική ισχύς το πιστεύω. Το θέμα είναι ότι δεν έχει υπάρξει κάποιο εγχειρημα (ή γνωρίζεις κάτι) τέτοιας κλίμακας.
Οι σκέψεις αυτές ξεπήδηξαν διαβάζοντας από http://norvig.com/ το άρθρο How to Write a Spelling Corrector και συνειδητοποίησα ότι η γνώση πολλές φορές υπάρχει απλά δε γνωρίζουμε να την εφαρμόσουμε σε άλλα πεδία. Η θεωρία που κρύβεται πίσω από το spelling corrector τόσο της google όσο και άλλων εταιριών είναι το θεώρημα του Bayes (βλ. επίσης bayesian spam filter) το οποίο το διδαχτήκαμε στο 3ο έτος του πανεπιστημίου στη στατιστική. Είμαι σίγουρος ότι κανένας από τους καθηγητές μας δε γνωρίζει αυτές τις εφαρμογές του θεωρήματος του Bayes, αλλά αυτό είναι off-topic.
Ίσως δηλαδή η γνώση και η τεχνολογία για την ανάπτυξη νοήμονων μηχανών να υπάρχει απλά να μην έχει συνδυαστεί κατάλληλα.
Υπάρχει ήδη "τεχνητή νοημοσύνη", για πολύ συγκεκριμένες εφαρμογές όμως. Προσωπικά θα ήθελα να δω περισσότερη "νοημοσύνη" στο desktop. Το KDE ήδη πλησιάζει σε αυτό το στόχο μέσα από πολλές προσπάθειες (nepomuk, simon, skanlite + ocropus + exactimage για OCR, Sonnet κλπ). Υπάρχει όμως ακόμα πολύς δρόμος και το κύριο εμπόδιο είναι ο τεράστιος όγκος "χαμαλοδουλειάς" η οποία στην πράξη μου φαίνεται δεν είναι και πολύ "αυτοματοποιήσιμη".
ReplyDeleteΓενικά τα HMMs και τα παράγωγα τους προσφέρουν τεράστια ευρωστία σε συστήματα με θέματα τεχνητής νοημοσύνης αλλά τείνουν να είναι πολύ computationally intensive (και προφανώς data-set dependent).
ReplyDeleteΑπλά το click για την τεχνητή νοημοσύνη είναι ότι πολλοί ακόμα δυσπιστούν στην ιδέα ότι είμαστε Bayesian beings και προσπαθούν να "διυλίσουν τον κώνωπα" με αναλυτικά μοντέλα που δεν λαμβάνουν priors υπόψην.
Από την εισαγωγή του κεφαλαίου 4, από Speech & Language Processing των Jurafsky & Martin :
But it must be recognised that the notion "probability of a sentence" is an entirely useless one, under any known interpretation of this term." Noam Chomsky (1969, p. 57)
"Anytime a linguist leaves the group the recognition rate goes up." Fred Jelinek ( τότε στο IBM Speech Group)
ps. Το θεώρημα του Bayes είναι συνήθως 1ο έτος, βαριά 2ο... :P
Σίγουρα χρειαζόμαστε περισσότερες νοήμονες desktop εφαρμογές (παρεπιμπτόντως για ocr μια ενδιαφέρουσα τεχνική είναι οι level set methods) αλλά εγώ σκεφτόμουν περισσότερο τις μηχανές. Για παράδειγμα υπάρχουν πάρα πολλές βιομηχανικές εγκαταστάσεις (βλ. χημικές βιομηχανιες, αυτοκινητοβιομηχανιες, κλπ), οι οποίες λειτουργούν με άπειρα "if ... then ... else ...". Θα μπορούσε κάποιος δηλαδή να εκπαιδεύσει ένα τέτοιο δίκτυο (Hidden Markov Model) και να έχει ένα σύστημα ελέγχου με "νοημοσύνη".
ReplyDeleteps. Σωστά, μάλλον 3ο εξάμηνο θα εννοούσα ;p