Του Άγη Βερούτη
Η προηγούμενη εβδομάδα ήταν ίσως η πιο πυκνή σε εξελίξεις για την Τεχνητή Νοημοσύνη από όσες έχω παρακολουθήσει. Με εξαίρεση την παρούσα εβδομάδα.
- το chatGPT 4.0 με 1 τρισεκατομμύριο παραμέτρους μπήκε online επιτρέποντας πολύ μεγαλύτερο αριθμό λέξεων στην απάντηση του κάθε ερωτήματος, αλλά και πολύ μεγαλύτερη attention, δηλαδή διάρκεια συνομιλίας, με το ΑΙ.
- αποκαλύφθηκε ότι τις προηγούμενες 5 εβδομάδες χρησιμοποιούμε το chatGPT4 μέσω του Microsoft Βing.
- η κινεζική baidu έβγαλε το δικό της μοντέλο που είναι ισοδύναμο με το chatGPT αλλά στα κινεζικά.
- η google έβγαλε το multimodal μοντέλο τεχνητής νοημοσύνης PaLM και έδωσε API στους πελάτες της με κόστος $0,0004/1000 τόκενς! Αυτό το έκανε πριν καταφέρει να βγάλει multimodal μοντέλο η Microsoft.
- την περασμένη Δευτέρα μια μικρή ομάδα φοιτητών του Stanford έφτιαξε το Alpaca, ένα σχεδόν ισοδύναμο με το chatGPT μοντέλο AI μεγέθους τσέπης, με κόστος κάτω από €600 σε σύγκριση με τα €4.500.000 που κόστισε η εκπαίδευση του chatGPT 3.5
- οι μεταπτυχιακοί φοιτητές του Stanford πήραν ένα ανοιχτού πηγαίου κώδικα μοντέλο Llama 7B της Meta (Facebook) με μόνον 7 δισεκατομμύρια παραμέτρους και το εκπαίδευσαν σε 175 οδηγίες απαντήσεων που έφτιαξαν μόνοι τους εντός μιας ημέρας.
Μετά έβαλαν ως παράδειγμα αυτές τις 175 οδηγίες στο chatGPT 3.5 API, και εκείνο δημιούργησε 52.000 οδηγίες-παραδείγματα (με κόστος $500 σε χρεώσεις) τις οποίες έβαλαν πίσω στο Alpaca και το εκπαίδευσαν (fine tuning) για 3 ώρες σε ένα σύστημα με 8 gpu A100.
- τα αποτελέσματα του Alpaca των 7 δισ. παραμέτρων σε διάφορες ερωτήσεις ήταν σχεδόν ίδιας απόδοσης σε τυχαίες ερωτήσεις με το chatGPT 3.5 των 175 δισ. παραμέτρων.
- αυτή η εξέλιξη θα μπορούσε να ανατρέψει ολόκληρη τη βιομηχανία της τεχνητής νοημοσύνης καθώς επιτεύχθηκε το 99% της μείωσης του κόστους που οι ειδικοί ανέμεναν να συμβεί περί το 2030. Όμως έγινε σε 15 εβδομάδες από το release του chatGPT!
Όπως πάει τον επόμενο ή μεθεπόμενο μήνα μπορεί να έχουμε Artificial General Intelligence ή μοντέλα τεχνητής νοημοσύνης με ισοδύναμη διαφαινόμενη ευφυΐα και δημιουργικότητα όσο ενός εξαιρετικά έξυπνου ανθρώπου...
Έχουμε ήδη περάσει από τη μέσα πλευρά του event-horizon του τεχνολογικού singularity που προκαλείται από την τεχνητή νοημοσύνη:
_"Το βασικό νόημα του βιβλίου του Ray Kurzweil "The Singularity is Near" που εκδόθηκε το 2006 είναι ότι πλησιάζουμε με γρήγορους ρυθμούς προς μια τεχνολογική ασυνέχεια, ένα χρονικό σημείο όταν η τεχνητή νοημοσύνη θα υπερβεί την ανθρώπινη νοημοσύνη και ο ρυθμός της τεχνολογικής προόδου θα γίνει τόσο γρήγορος και βαθύς που θα μετασχηματίσει θεμελιωδώς την ανθρώπινη κοινωνία και ακόμα και την ίδια μας τη φύση."_
[Ο όρος technological singularity είναι δανεισμένος από το singularity το οποίο βρίσκεται στο κέντρο μιας Μαύρης Τρύπας, όπου είναι αδύνατον να γνωρίζουμε τι συμβαίνει στο εσωτερικό του ορίζοντα γεγονότων (το event horizon) όπου η καμπυλότητα του χωροχρόνου -ή βαρυτική έλξη- είναι τόσο μεγάλη που η ταχύτητα διαφυγής ξεπερνάει την ταχύτητα του φωτός, οπότε καμία πληροφορία για το τι συμβαίνει μέσα από αυτόν τον ορίζοντα δεν βγαίνει εκτός.]
_"Ο Kurzweil παρουσιάζει ένα μεγάλο αριθμό από αποδείξεις και επιχειρήματα για να υποστηρίξει τη θέση του, αναφερόμενος σε πεδία τόσο διαφορετικά όπως η επιστήμη υπολογιστών, η νευροεπιστήμη και η νανοτεχνολογία. Υποστηρίζει ότι ήδη βλέπουμε τα πρώτα σημάδια της ασυνέχειας στον επιταχυνόμενο ρυθμό της τεχνολογικής καινοτομίας και ότι στις επόμενες δεκαετίες μπορούμε να αναμένουμε την εμφάνιση προηγμένης τεχνητής νοημοσύνης, τεχνολογιών επέκτασης της ζωής και ακόμη και τη δυνατότητα συγχώνευσης ανθρώπων και μηχανών.
Ο Kurzweil αναφέρεται επίσης στους δυνητικούς κινδύνους και προκλήσεις της ασυνέχειας, συμπεριλαμβανομένης της δυνατότητας ενός εκτροχιασμού της υπερνοημοσύνης που μπορεί να απειλήσει την ύπαρξη της ανθρωπότητας.
Παρά τους κινδύνους αυτούς, όμως, υποστηρίζει ότι η ασυνέχεια αντιπροσωπεύει μια τεράστια ευκαιρία για την ανθρωπότητα να ξεπεράσει ορισμένες από τις μεγαλύτερες προκλήσεις της και να επιτύχει ένα νέο επίπεδο ευημερίας και ευτυχίας."_
Η πρόβλεψη του Kurzweil ήταν ότι αυτή η ασυνέχεια (singularity) θα συμβεί ανάμεσα στο 2029 και το 2045.
Οι εξελίξεις των τελευταίων 10 ημερών στο οποίο διάστημα το κόστος εκπαίδευσης μιας τεχνητής νοημοσύνης του τύπου Generative Pre-trained Transformer με σχεδόν ανθρώπινη νοημοσύνη, έπεσε από τα $4,5-$5 εκατομμύρια στα $600. Σε δέκα μέρες δηλαδή υπήρξε μείωση όση αναμενόταν να συμβεί στα επόμενα 6 χρόνια, ως το 2030.
Οι ανακοινώσεις για νέα μοντέλα τεχνητής νοημοσύνης των πρώτων 2 ημερών αυτής της εβδομάδος πλησιάζουν τις συνολικές ανακοινώσεις της προηγούμενης εβδομάδας που ξεπερνούν εκείνες του προηγούμενου έτους!
Μοιάζει ο Kurzweil να έπεσε έξω κατά 7 χρόνια ως προς την πιο επιθετική πρόβλεψή του.
Αυτά που θα δούμε από εδώ και μπρος ως τεχνολογική και κοινωνική αλλαγή κανείς δεν θα μπορούσε να τα προβλέψει από την έξω πλευρά του ορίζοντα γεγονότων του οποίου ήδη βρισκόμαστε μέσα.
Κανείς δεν ξέρει αν η δουλειά του θα εκλείψει από έναν απόφοιτο λυκείου που ξέρει να κάνει καλά prompts στο chatGPT, η αν σε 1 χρόνο θα υπάρχουν διαφημιστικές εταιρείες ή το δημιουργικό θα το φτιάχνει μια γραμματέας με βασικές γνώσεις χρήσης μιας Τεχνητής Νοημοσύνης όπως το Dall-e ή ένα άλλο Multimodal Text-to-image ή text-to-video εργαλείο.
Κανείς δεν ξέρει αν μια εταιρεία τεχνητής νοημοσύνης που ακόμη βρίσκεται ως ιδέα στο μυαλό ενός πιτσιρικά θα ξηλώσει έναν ολόκληρο τομέα της οικονομίας όπως οι συμβουλευτικές υπηρεσίες.
Κανείς δεν ξέρει αν ένα σύστημα ιατρικών διαγνώσεων με τεχνητή νοημοσύνη εκπαιδευμένο με data από δισεκατομμύρια ιατρικές περιπτώσεις θα έχει 100% επιτυχία στις διαγνώσεις ή ακόμα και προγνώσεις ασθενειών με βάση κάποιες ενδείξεις που σήμερα περνούν απαρατήρητες, τελειώνοντας την ανάγκη για γιατρούς που κάνουν διαγνώσεις.
Κανείς δεν ξέρει αν η επόμενη μεγάλη εφεύρεση για την ενέργεια θα έρθει από έναν αφρικανό έφηβο που παίζει με μια τεχνητή νοημοσύνη μέσω Ίντερνετ από το κινητό του σε μια περιοχή που δεν έχει καν δίκτυο ηλεκτρικού.
Κανείς δεν ξέρει αν η επόμενη τεχνητή νοημοσύνη του κρατικού μηχανισμού θα βρίσκει τους φοροφυγάδες από συνήθειές τους όπως να κερδίζουν λοταρίες ή να πουλάνε ακίνητα σε διπλή-τριπλή τιμή από της αγοράς.
Κανείς δεν ξέρει αν οι μεγάλες εταιρείες θα εκπαιδεύσουν μοντέλα ΑΙ στα εταιρικά τους data και θα πάρουν μερίδιο της αγοράς που δεν ονειρεύονταν πριν λίγο, ή αν θα κλείσουν επειδή μια μικρή εταιρεία υλοποίησε σε χρόνο μηδέν το δικό της ΑΙ και τους έβγαλε εκτός αγοράς αλλάζοντας το business model αυτής της αγοράς.
Προσδεθείτε!
Εμείς βέβαια εδώ έχουμε γενικές απεργίες που κοντεύουν να σπάσουν την αγορά, για να μη γίνεται αξιολόγηση στους δημόσιους υπαλλήλους…
-/-
ΥΓ: Το παραπάνω κείμενο της περιγραφής το οποίο βρίσκεται εντός εισαγωγικών _"[…]"_ ΔΕΝ ΤΟ ΕΓΡΑΨΑ ΕΓΩ!
Το έγραψε το chatGPT 4, μετά από ερώτηση μου στα αγγλικά και κατόπιν
εντολής μου για να το μεταφράσει στα ελληνικά, έβγαλε το παραπάνω
κείμενο. Με ελάχιστες βελτιώσεις στο νόημα (5-10 λέξεις) το αντέγραψα.
[Αυτό είναι το πρώτο άρθρο μου όπου μέρος του το έγραψε κατά παραγγελία μια τεχνητή νοημοσύνη]
====================
Νίκος Πρασσάς
Σχόλια