Αντιμέτωπες με μια άβολη αλήθεια δείχνουν να βρίσκονται οι εταιρείες που δραστηριοποιούνται στην τεχνητή νοημοσύνη, καθώς πληθαίνουν οι ενδείξεις ότι ο δρόμος για την υπερ-ευφυία δεν είναι τόσο καλοστρωμένος όσο θα ήθελαν.
Για αρκετά χρόνια επικρατούσε η εκτίμηση ότι τα γλωσσικά μοντέλα θα γίνονται αποτελεσματικότερα όσο μεγαλώνουν σε μέγεθος. Αυτή η κλιμάκωση, ωστόσο, δεν δείχνει να έχει τα προσδοκώμενα αποτελέσματα. Κάποιοι λένε ότι η εξέλιξη των συστημάτων τεχνητής νοημοσύνης έχει συναντήσει ένα επίμονο σημείο αντίστασης, έναν τοίχο. Κατ’ αναλογία μοιάζει με το 30ο χιλιόμετρο ενός μαραθωνίου, όπου πολλοί δρομείς εγκαταλείπουν την προσπάθεια.
Εργαζόμενοι της OpenAI αφήνουν να εννοηθεί ότι βλέπουν τη δική τους εκδοχή του 30ου χιλιομέτρου στο γλωσσικό μοντέλο Orion που αναπτύσσουν αυτή την περίοδο. Υποστηρίζουν ότι το Orion δεν θα αποτελέσει τόσο μεγάλη εξέλιξη σε σχέση με το GPT-4 και δεν θα είναι τόσο εντυπωσιακό όσο είναι το GPT-4 σε σύγκριση με το GPT-3. Ο Sam Altman, διευθύνων σύμβουλος της OpenAI, αρνείται ότι υπάρχει τοίχος, ενώ σε κάθε ευκαιρία επαναλαμβάνει ότι όσο μεγαλύτερα τα γλωσσικά μοντέλα τόσο μεγαλύτερη η αποτελεσματικότητά τους.
Όσο μεγαλύτερη υπολογιστική ισχύ και όσο περισσότερα δεδομένα έχουμε διαθέσιμα, τόσο καλύτερο γίνονται τα γλωσσικά μοντέλα, υποστήριξε ο Altman σε ένα κείμενο-μανιφέστο που έγραψε πριν από λίγους μήνες.
«Τα μοντέλα τεχνητής νοημοσύνης θα λειτουργήσουν σύντομα ως αυτόνομοι προσωπικοί βοηθοί που θα εκτελούν συγκεκριμένα καθήκοντα για λογαριασμό μας», έγραψε προσθέτοντας ότι από κάποιο σημείο και μετά τα συστήματα τεχνητής νοημοσύνης θα βοηθούν για «να φτιάξουμε καλύτερα συστήματα επόμενης γενιάς και να σημειώσουμε επιστημονική πρόοδο σε όλους τους τομείς». Ο Altman υποστηρίζει, δηλαδή, ότι από ένα σημείο και μετά, τα συστήματα τεχνητής νοημοσύνης θα βοηθούν στην παραγωγή συστημάτων νέας γενιάς. Επεκτείνοντας τη σκέψη του μπορεί, υποθετικά, να φτάσουμε σε πλήρως αυτονομημένα συστήματα τεχνητής νοημοσύνης που θα εξελίσσονται μόνα τους.
Κάτι θυμίζει αυτό, όμως για να φτάσουμε ως εκεί χρειάζονται δεδομένα που θα αποτελέσουν τη διδακτέα ύλη για την εκπαίδευση των γλωσσικών μοντέλων. Εδώ έγκειται ένα σοβαρό πρόβλημα που εμποδίζει την κλιμάκωση, την εξέλιξη των συστημάτων τεχνητής νοημοσύνης.
OpenAI, Google, Meta, Anthropic και λοιπές δυνάμεις έχουν «σκουπίσει» το διαδίκτυο και έχουν συγκεντρώσει κάθε δεδομένο που έχουν βρει στο διάβα τους. Έχουν αντιγράψει κείμενα από εφημερίδες περιοδικά και βιβλιοθήκες -με αποτέλεσμα να αντιμετωπίζουν και νομικά προβλήματα-, έχουν σαρώσει πλατφόρμες βίντεο μετατρέποντας τους διαλόγους σε κείμενο και έχουν επιστρατεύσει εκατοντάδες χιλιάδες ανθρώπους από κάθε επιστημονικό πεδίο και κάθε κοινωνικό υπόβαθρο για να εκπαιδεύσουν τα μοντέλα τους.
Τα ανθρωπογενή δεδομένα αποτελούν σήμερα τη διδακτική ύλη των γλωσσικών μοντέλων. Η χρήση συνθετικών δεδομένων, δηλαδή δεδομένων που έχουν δημιουργηθεί από τα ίδια τα συστήματα τεχνητής νοημοσύνης μοιάζει να είναι λύση, αφού δεν εμπεριέχουν προσωπικά δεδομένα και είναι δομημένα με τρόπο που μια μηχανή μπορεί να τα «αντιληφθεί» καλύτερα. Όμως πολλές φορές είναι αποτέλεσμα «παραίσθησης», του φαινομένου δηλαδή όπου ένα σύστημα τεχνητής νοημοσύνης παράγει αναληθή δεδομένα. Υπάρχει μεν μια κάποια πρόοδος στην ποιότητα των συνθετικών δεδομένων όπως φαίνεται και από σχετικές μελέτες, όμως αδυνατούν να περιγράψουν τον πραγματικό κόσμο με την ακρίβεια (και τον ανοργάνωτο, από την οπτική γωνία της μηχανής) τρόπο των ανθρώπων.
Αντίθετα με τον Altman, o Ilya Sutskever, ο οποίος παραιτήθηκε από την OpenAI για να φτιάξει την Safe Superintelligence, υποστηρίζει ότι η κλιμάκωση, δηλαδή η περαιτέρω ανάπτυξη των συστημάτων τεχνητής νοημοσύνης έχει φτάσει στο όριό της. «Βρισκόμαστε πάλι στην περίοδο όπου ο καθένας εξερευνά το επόμενο στάδιο. Η κλιμάκωση του σωστού πράγματος έχει τώρα μεγαλύτερη σημασία από ποτέ», δήλωσε ο Sutskever στο Reuters.
Τις δυσκολίες που παραδέχονται στελέχη της OpenAI -και αρνείται ο Altman- αντιμετωπίζουν και άλλες εταιρείες. Οι επόμενες εκδόσεις του Gemini της Google και του Claude της Anthropic συναντούν παρόμοια προβλήματα με αυτά που βλέπουν οι άνθρωποι της OpenAI στο Orion – υπάρχει ανάπτυξη αλλά ο ρυθμός είναι χαμηλότερος του προηγουμένου.
Η κατάσταση θυμίζει λίγο την ανάπτυξη των παιδιών, που στα πρώτα χρόνια της ζωής τους είναι εκρηκτική και σταδιακά επιβραδύνει για να σταματήσει σταδιακά με το πέρασμα στην ενηλικίωση. Μόνο που οι προσδοκίες που έχουν καλλιεργηθεί για τα γλωσσικά μοντέλα ξεπερνούν κατά πολύ αυτές που έχουν -συνήθως- οι γονείς για τα παιδιά τους, ενώ γύρω από τις εταιρείες του κλάδου έχει στηθεί ένας χορός εκατοντάδων δισεκατομμυρίων.
Είναι πολλά τα λεφτά… Πάρα πολλά…
Ενδεχομένως -και υιοθετώντας μια άλλη συμπεριφορά που χαρακτηρίζει τους γονείς- οι εταιρείες να ζητούν από τα γλωσσικά τους μοντέλα περισσότερα από όσα εκείνα είναι σε θέση να προσφέρουν.
Για την ώρα, οι υπηρεσίες που χρησιμοποιούμε στην καθημερινότητά μας μπορούν να μας δώσουν δημιουργικές ιδέες για μια εικονογράφηση, μια ιστορία ή ένα πρόγραμμα. Μπορούν να δημιουργήσουν μια αληθοφανή ή διασκεδαστική παραγωγή βίντεο. Μπορούν να μας βοηθήσουν να οργανώσουμε ένα ταξίδι και να συνθέσουν περιλήψεις λαμβάνοντας υπόψιν διαφορετικές πηγές. Είναι, δηλαδή, σε θέση να κάνουν αρκετή πνευματική χαμαλοδουλειά κατ’ αναλογία με τα μηχανικά ρομπότ που κάνουν επαναλαμβανόμενες κινήσεις σε μια γραμμή παραγωγής.
Στερούνται όμως της δυνατότητας να αντιληφθούν (χωρίς εισαγωγικά) τη σχέση αιτίας – αποτελέσματος. Η επιβράδυνση στην εξέλιξη των γλωσσικών μοντέλων ίσως να δείχνει ότι πράγματι χρειάζεται κάτι άλλο που θα βοηθήσει στην ανάπτυξη της τεχνητής νοημοσύνης και στη δημιουργία του φουτουριστικού περιβάλλοντος για το οποίο μιλούν οι θιασώτες της.
Βεβαίως, όσοι φοβούνται ότι μια ώριμη και αυτάρκης τεχνητή νοημοσύνη θα αποτελέσει την τελευταία (και κακή) ιδέα της ανθρωπότητας δεν έχουν παρά να νιώσουν ανακούφιση διαβάζοντας ότι οι εταιρείες έχουν κολλήσει στο 30ό χιλιόμετρο του μαραθωνίου τους.
Όπως όμως συμβαίνει και στους αγώνες δρόμου, δεν εγκαταλείπουν όλοι την κούρσα…