Η έναρξη της κούρσας εξοπλισμών για την Τεχνητή Νοημοσύνη είχε ως στόχο την ανάπτυξη μεγάλων επιχειρήσεων: Γιγαντιαία μοντέλα που εκπαιδεύτηκαν σε τεράστιους όγκους δεδομένων, προσπαθώντας να μιμηθούν την ανθρώπινη νοημοσύνη.
Τώρα, οι τεχνολογικοί «κολοσσοί» και οι AI startups σκέφτονται μικρότερα, καθώς μειώνουν το λογισμικό Τεχνητής Νοημοσύνης για να το κάνουν φθηνότερο, ταχύτερο και πιο εξειδικευμένο.
Αυτή η κατηγορία λογισμικού ΤΝ – τα λεγόμενα μικρά ή μεσαία γλωσσικά μοντέλα – εκπαιδεύονται σε λιγότερα δεδομένα και συχνά σχεδιάζονται για συγκεκριμένες εργασίες.
Τα μεγαλύτερα μοντέλα, όπως το GPT-4 της OpenAI, κοστίζουν περισσότερα από 100 εκατομμύρια δολάρια για να αναπτυχθούν και χρησιμοποιούν περισσότερες από ένα τρισεκατομμύριο παραμέτρους, μια μέτρηση του μεγέθους τους.
Αντίθετα, τα μικρότερα μοντέλα εκπαιδεύονται συχνά σε στενότερα σύνολα δεδομένων – για παράδειγμα, μόνο σε νομικά ζητήματα- και μπορεί να κοστίζουν λιγότερο από 10 εκατ. δολάρια για την εκπαίδευσή τους, χρησιμοποιώντας λιγότερες από 10 δισ. παραμέτρους. Τα μικρότερα μοντέλα χρησιμοποιούν επίσης λιγότερη υπολογιστική ισχύ, και συνεπώς κοστίζουν λιγότερο, για να απαντήσουν σε κάθε ερώτημα.
Η Microsoft ανέδειξε την οικογένεια μικρών μοντέλων της με την ονομασία Phi, τα οποία, σύμφωνα με τον διευθύνοντα σύμβουλο Σάτια Ναντέλα, έχουν το 1/100 του μεγέθους του δωρεάν μοντέλου που βρίσκεται πίσω από το ChatGPT του OpenAI και εκτελούν πολλές εργασίες σχεδόν εξίσου καλά.
Η Microsoft ήταν μία από τις πρώτες μεγάλες εταιρείες τεχνολογίας που πόνταρε δισεκατομμύρια δολάρια στη Δημιουργική Τεχνητή Νοημοσύνη (GenAI) και η εταιρεία συνειδητοποίησε γρήγορα ότι η λειτουργία της γινόταν πιο δαπανηρή από ό,τι είχε αρχικά προβλέψει .
Η εταιρεία λάνσαρε επίσης πρόσφατα φορητούς υπολογιστές τεχνητής νοημοσύνης που χρησιμοποιούν δεκάδες μοντέλα τεχνητής νοημοσύνης για την αναζήτηση και τη δημιουργία εικόνων. Τα μοντέλα απαιτούν τόσο λίγα δεδομένα που μπορούν να εκτελούνται σε μια συσκευή και δεν απαιτούν πρόσβαση σε τεράστιους υπερυπολογιστές που βασίζονται στο cloud, όπως κάνει η ChatGPT.
Η Google -καθώς και οι νεοφυείς επιχειρήσεις AI Mistral, Anthropic και Cohere- έχουν επίσης κυκλοφορήσει μικρότερα μοντέλα φέτος. Η Apple παρουσίασε τον Ιούνιο τον δικό της χάρτη πορείας για την τεχνητή νοημοσύνη με σχέδια για τη χρήση μικρών μοντέλων, ώστε να μπορεί να εκτελεί το λογισμικό εξ ολοκλήρου σε τηλέφωνα για να το κάνει ταχύτερο και ασφαλέστερο.
Ακόμα και η OpenAI, η οποία ήταν στην πρωτοπορία του κινήματος των μεγάλων μοντέλων, κυκλοφόρησε πρόσφατα μια έκδοση του κορυφαίου της μοντέλου που λέει ότι είναι φθηνότερη στη λειτουργία.
Για πολλές εργασίες, όπως η σύνοψη εγγράφων ή η δημιουργία εικόνων, τα μεγάλα γλωσσικά μοντέλα μπορεί να είναι υπερβολικά – το ισοδύναμο του να οδηγείς ένα τανκ για να κάνεις ψώνια.
Οι επιχειρήσεις και οι καταναλωτές αναζητούν επίσης τρόπους για να τρέξουν φθηνότερα την τεχνολογία που βασίζεται στην Τεχνητή Νοημοσύνη, όταν οι αποδόσεις της είναι ακόμη ασαφείς.
Το κλειδί είναι η εστίαση αυτών των μικρότερων μοντέλων σε ένα σύνολο δεδομένων, όπως εσωτερικές επικοινωνίες, νομικά έγγραφα ή αριθμούς πωλήσεων, ώστε να εκτελούν συγκεκριμένες εργασίες, όπως η συγγραφή μηνυμάτων ηλεκτρονικού ταχυδρομείου – μια διαδικασία γνωστή ως fine-tuning. Αυτή η διαδικασία επιτρέπει στα μικρά μοντέλα να αποδίδουν εξίσου αποτελεσματικά με ένα μεγάλο μοντέλο σε αυτές τις εργασίες με ένα κλάσμα του κόστους.
Πηγή: liberal.gr