Οι AI startups μειώνουν το λογισμικό Τεχνητής Νοημοσύνης για να το κάνουν φθηνότερο και ταχύτερο

Η έναρξη της κούρσας εξοπλισμών για την Τεχνητή Νοημοσύνη είχε ως στόχο την ανάπτυξη μεγάλων επιχειρήσεων: Γιγαντιαία μοντέλα που εκπαιδεύτηκαν σε τεράστιους όγκους δεδομένων, προσπαθώντας να μιμηθούν την ανθρώπινη νοημοσύνη.

Τώρα, οι τεχνολογικοί «κολοσσοί» και οι AI startups σκέφτονται μικρότερα, καθώς μειώνουν το λογισμικό Τεχνητής Νοημοσύνης για να το κάνουν φθηνότερο, ταχύτερο και πιο εξειδικευμένο.

Αυτή η κατηγορία λογισμικού ΤΝ – τα λεγόμενα μικρά ή μεσαία γλωσσικά μοντέλα – εκπαιδεύονται σε λιγότερα δεδομένα και συχνά σχεδιάζονται για συγκεκριμένες εργασίες.

Τα μεγαλύτερα μοντέλα, όπως το GPT-4 της OpenAI, κοστίζουν περισσότερα από 100 εκατομμύρια δολάρια για να αναπτυχθούν και χρησιμοποιούν περισσότερες από ένα τρισεκατομμύριο παραμέτρους, μια μέτρηση του μεγέθους τους.

Αντίθετα, τα μικρότερα μοντέλα εκπαιδεύονται συχνά σε στενότερα σύνολα δεδομένων – για παράδειγμα, μόνο σε νομικά ζητήματα- και μπορεί να κοστίζουν λιγότερο από 10 εκατ. δολάρια για την εκπαίδευσή τους, χρησιμοποιώντας λιγότερες από 10 δισ. παραμέτρους. Τα μικρότερα μοντέλα χρησιμοποιούν επίσης λιγότερη υπολογιστική ισχύ, και συνεπώς κοστίζουν λιγότερο, για να απαντήσουν σε κάθε ερώτημα.

Η Microsoft ανέδειξε την οικογένεια μικρών μοντέλων της με την ονομασία Phi, τα οποία, σύμφωνα με τον διευθύνοντα σύμβουλο Σάτια Ναντέλα, έχουν το 1/100 του μεγέθους του δωρεάν μοντέλου που βρίσκεται πίσω από το ChatGPT του OpenAI και εκτελούν πολλές εργασίες σχεδόν εξίσου καλά.

Η Microsoft ήταν μία από τις πρώτες μεγάλες εταιρείες τεχνολογίας που πόνταρε δισεκατομμύρια δολάρια στη Δημιουργική Τεχνητή Νοημοσύνη (GenAI) και η εταιρεία συνειδητοποίησε γρήγορα ότι η λειτουργία της γινόταν πιο δαπανηρή από ό,τι είχε αρχικά προβλέψει .

Η εταιρεία λάνσαρε επίσης πρόσφατα φορητούς υπολογιστές τεχνητής νοημοσύνης που χρησιμοποιούν δεκάδες μοντέλα τεχνητής νοημοσύνης για την αναζήτηση και τη δημιουργία εικόνων. Τα μοντέλα απαιτούν τόσο λίγα δεδομένα που μπορούν να εκτελούνται σε μια συσκευή και δεν απαιτούν πρόσβαση σε τεράστιους υπερυπολογιστές που βασίζονται στο cloud, όπως κάνει η ChatGPT.

Η Google -καθώς και οι νεοφυείς επιχειρήσεις AI Mistral, Anthropic και Cohere- έχουν επίσης κυκλοφορήσει μικρότερα μοντέλα φέτος. Η Apple παρουσίασε τον Ιούνιο τον δικό της χάρτη πορείας για την τεχνητή νοημοσύνη με σχέδια για τη χρήση μικρών μοντέλων, ώστε να μπορεί να εκτελεί το λογισμικό εξ ολοκλήρου σε τηλέφωνα για να το κάνει ταχύτερο και ασφαλέστερο.

Ακόμα και η OpenAI, η οποία ήταν στην πρωτοπορία του κινήματος των μεγάλων μοντέλων, κυκλοφόρησε πρόσφατα μια έκδοση του κορυφαίου της μοντέλου που λέει ότι είναι φθηνότερη στη λειτουργία.

Για πολλές εργασίες, όπως η σύνοψη εγγράφων ή η δημιουργία εικόνων, τα μεγάλα γλωσσικά μοντέλα μπορεί να είναι υπερβολικά – το ισοδύναμο του να οδηγείς ένα τανκ για να κάνεις ψώνια.

Οι επιχειρήσεις και οι καταναλωτές αναζητούν επίσης τρόπους για να τρέξουν φθηνότερα την τεχνολογία που βασίζεται στην Τεχνητή Νοημοσύνη, όταν οι αποδόσεις της είναι ακόμη ασαφείς.

Το κλειδί είναι η εστίαση αυτών των μικρότερων μοντέλων σε ένα σύνολο δεδομένων, όπως εσωτερικές επικοινωνίες, νομικά έγγραφα ή αριθμούς πωλήσεων, ώστε να εκτελούν συγκεκριμένες εργασίες, όπως η συγγραφή μηνυμάτων ηλεκτρονικού ταχυδρομείου – μια διαδικασία γνωστή ως fine-tuning. Αυτή η διαδικασία επιτρέπει στα μικρά μοντέλα να αποδίδουν εξίσου αποτελεσματικά με ένα μεγάλο μοντέλο σε αυτές τις εργασίες με ένα κλάσμα του κόστους.

Πηγή: liberal.gr

Η ADAPTIT ενσωματώνει την πλατφόρμα IBM MAS στα ψηφιακά εργαλεία της TELCOSERV

Πληροφορική: Σε ρυθμό εξαγορών με διψήφια ανάπτυξη φέτος

Performance Technologies: Αύξηση 28,5% στα έσοδα (74,2 εκατ.) και 31,4% στα μικτά κέρδη το 2024

Profile: Ρεκόρ ανάπτυξης το 2024 με αύξηση κύκλου εργασιών και κερδοφορίας

Η Intracom Telecom εκσυγχρονίζει το δίκτυο της Sky Telecom με τεχνολογίες σταθερής ασύρματης πρόσβασης

Πρωτιά στην Ευρώπη χάρη στο δίκτυο 5G+ της COSMOTE

Αλλαγή σκυτάλης στη Vodafone Ελλάδας και νέα επιχειρηματική πρωτοβουλία του Χάρη Μπρουμίδη

Αποτελέσματα της 62ης Ολομέλειας του BEREC

Σταύρος Καλαφάτης: “Με ανάπτυξη, έρευνα και καινοτομία δίνουμε στήριξη σε κοινωνία και επιχειρήσεις”

Patent Index 2024: Η ευρωπαϊκή καινοτομία παραμένει ισχυρή εν μέσω παγκόσμιων οικονομικών αβεβαιοτήτων

Σταύρος Καλαφάτης: “Η Έρευνα και η Καινοτομία αποτελούν βασικά συστατικά της ανάπτυξης στη νέα εποχή”

Άννα Μάνη – Παπαδημητρίου: «Μοχλός καινοτομίας και ανάπτυξης η προστασία της διανοητικής ιδιοκτησίας»

YPSILON Care Tech: Νέος Τεχνοβλαστός του Ινστιτούτου Πληροφορικής του ΙΤΕ στην Ψηφιακή Υγεία

H MANTEO AI νέο μέλος του ESA BIC Greece

Στο advisory board της AfterSalesPro ο Γιώργος Μαρκατάτος

MWC 2025: Από νεοφυής επιχείρηση σε “μονόκερο” – Ποιοι είναι οι επόμενοι μεγάλοι παίκτες

Ο Alexander Oyaert είναι ο νέος Chief Investment Officer της Data4

Uniko: Ο πρώτος ψηφιακός μεσίτης ακινήτων στην Ελλάδα, με την υπογραφή Εθνικής Τράπεζας και Qualco

Μόλις τo 21% των μικρών εταιρειών στην Ελλάδα επενδύει στην τεχνολογία

ΔΕΗ: Νέο επενδυτικό σχέδιο για τη Δυτική Μακεδονία – Επενδύσεις έως 12 δισ. ευρώ

Πρεμιέρα για το αναβαθμισμένο ψηφιακό πορτοφόλι στο gov.gr wallet

Εγκαινιάζεται ο Εθνικός Υπερυπολογιστής «ΔΑΙΔΑΛΟΣ» στο Λαύριο – Στρατηγική επένδυση στην καινοτομία

Dotsoft: Συνεργασία για τον ψηφιακό μετασχηματισμό του δήμου Παγγαίου

Διαθέσιμη η πλατφόρμα «Know Your Business» – Ψηφιακά η επικοινωνία επιχειρήσεων με τράπεζες

Ο Όμιλος AKTOR υπέγραψε τη σύμβαση για το μεγάλο έργο ΣΔΙΤ των φοιτητικών εστιών Κρήτης

Χρ. Δήμας: Η νέα γέφυρα Αφρατίου βελτιώνει σημαντικά το οδικό δίκτυο στην Εύβοια

Μανουσάκης (ΑΔΜΗΕ): Ισχυρή βούληση για τη συνέχιση του Great Sea Interconnector

ΑΔΜΗΕ: Αίτημα ένταξης της νέας διασύνδεσης Ελλάδας – Ιταλίας στο PCI/PMI

TAGS:

ΡΟΗ ΕΙΔΗΣΕΩΝ

Ο Alexander Oyaert είναι ο νέος Chief Investment Officer της Data4

Uniko: Ο πρώτος ψηφιακός μεσίτης ακινήτων στην Ελλάδα, με την υπογραφή Εθνικής Τράπεζας και Qualco

Μόλις τo 21% των μικρών εταιρειών στην Ελλάδα επενδύει στην τεχνολογία

Μητσοτάκης: Ο παγκόσμιος εμπορικός πόλεμος δεν θα ωφελήσει κανέναν

ΔΕΗ: Νέο επενδυτικό σχέδιο για τη Δυτική Μακεδονία – Επενδύσεις έως 12 δισ. ευρώ

Artificial Intelligence (AI)

Στα 644 δισ. δολάρια οι δαπάνες για το GenAΙ το 2025 – Εκρηκτική αύξηση 77%

Tinder: Εισάγει παιχνίδι για εξάσκηση στο φλερτ με ρομπότ ΤΝ

Qualcomm: Εξαγόρασε το τμήμα AI της VinAI και επεκτείνει την κυριαρχία της στην ΤΝ

Σαμ Άλτμαν: Καθυστερήσεις στη λειτουργία του OpenAI λόγω περιορισμένης χωρητικότητας

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών και Google προσφέρουν εκπαίδευση στην Τεχνητή Νοημοσύνη

#LeonteiosAI – Διαμορφώνοντας το μέλλον της Μάθησης

Η xAI εξαγοράζει την X – Nέα εποχή για την Τεχνητή Νοημοσύνη

Κομισιόν: Επενδύει 1,3 δισ. ευρώ σε Τεχνητή Νοημοσύνη και κυβερνοασφάλεια