Με μια κίνηση που έφερε τα πάνω κάτω στην παγκόσμια αγορά μοντέλων Τεχνητής Νοημοσύνης, η Κίνα απάντησε άμεσα στις εξαγγελίες του προέδρου των ΗΠΑ Ντόναλντ Τραμπ, παρουσιάζοντας ένα δωρεάν μοντέλο που έχει τις αντίστοιχες δυνατότητες του επι πληρωμή μοντέλου της Open AI, και μάλιστα εντελών δωρεάν.
Το DeepSeek V3, είναι προϊόν μιας άγνωστης έως τώρα κινεζικής startup AI DeepSeek η οποία υποστηρίζει πως το δικό της μοντέλο απαιτεί πολύ λιγότερη υπολογιστική δύναμη (με ότι σημαίνει αυτό για το κόστος της επένδυσης σε ενέργεια και υπολογιστικούς πόρους), απειλεί άμεσα την μέχρι τώρα πρωτοκαθεδρία των ΗΠΑ στο συγκεκριμένο τομέα, ενώ με την απόφαση να προσφέρει ένα open source προϊόν, αντέκρουσε άμεσα τις όποιες ενδεχόμενες κατηγορίες της Δύσης για εκμετάλλευση των προσωπικών στοιχείων των χρηστών από την Κινεζική κυβέρνηση.
Σύμφωνα με το Reuters, το DeepSeek ξεπέρασε σήμερα το ChatGPT έγινε η κορυφαία (top rated) δωρεάν εφαρμογή που είναι διαθέσιμη στο App Store της Apple στις ΗΠΑ: Με βάση το μοντέλο DeepSeek-V3, εκτοξεύτηκε στα ύψη των προτιμήσεων των χρηστών στις ΗΠΑ από τότε που κυκλοφόρησε στις 10 Ιανουαρίου, σύμφωνα με την εταιρεία Sensor Tower.
Ποια είναι η DeepSeek
Η DeepSeek ιδρύθηκε το 2023 από τον Liang Wenfeng, τον επικεφαλής του προσανατολισμένου στην AI hedge fund High-Flyer. Η εταιρεία αναπτύσσει μοντέλα AI που είναι ανοικτού κώδικα, που σημαίνει ότι ένας οποιοσδήποτε από την ανοιχτή κοινότητα των developers μπορεί να επέμβει το λογισμικό. Η εφαρμογή της για κινητά τηλέφωνα σημείωσε ραγδαία αύξηση για iPhone στις ΗΠΑ μετά την κυκλοφορία της στις αρχές του Ιανουαρίου.
Η εφαρμογή διακρίνεται από άλλα chatbots, όπως το ChatGPT της OpenAI, εξηγώντας το σκεπτικό του πριν δώσει απάντηση σε μια προτροπή. Η εταιρεία ισχυρίζεται ότι η έκδοση R1 προσφέρει επιδόσεις εφάμιλλες με τις τελευταίες του OpenAI και έχει παραχωρήσει άδεια χρήσης σε ιδιώτες που ενδιαφέρονται να αναπτύξουν chatbots χρησιμοποιώντας την τεχνολογία για να βασιστούν σε αυτήν.
H DeepSeek ανέφερε πως η εκπαίδευση ενός από τα τελευταία μοντέλα της κόστισε 5,6 εκατομμύρια δολάρια- πολύ μικρό ποσό σε σχέση με αυτά που έχουν αναφερθεί κατά καιρούς ως κόστος κατασκευής ενός μοντέλου ΑΙ. Η πολύ καλύτερη αποδοτικότητα του μοντέλου θέτει την ανάγκη για τεράστιες κεφαλαιακές δαπάνες για την απόκτηση των πιο πρόσφατων και ισχυρότερων επιταχυντών τεχνητής νοημοσύνης από εταιρείες όπως η Nvidia.
Αυτό επίσης ενισχύει την προσοχή στους περιορισμούς των αμερικανικών εξαγωγών τέτοιων προηγμένων ημιαγωγών προς την Κίνα – οι οποίες είχαν ως στόχο να αποτρέψουν μια επανάσταση του είδους που η DeepSeek φαίνεται να αντιπροσωπεύει. Η DeepSeek λέει ότι η R1 είναι κοντά ή ήδη καλύτερη από τα αντίπαλα μοντέλα σε διάφορα κορυφαία συγκριτικά κριτήρια, όπως το AIME 2024 για τις μαθηματικές εργασίες, MMLU για γενικές γνώσεις και AlpacaEval 2.0 για απόδοση ερωτήσεων και απαντήσεων. Κατατάσσεται επίσης μεταξύ των κορυφαίων επιδόσεων σε ένα UC Berkeley που ονομάζεται Chatbot Arena.
Σε ελεύθερη πτώση οι τεχνολογικές μετοχές
Η ολοένα αυξανόμενη δημοφιλία του DeepSeek μέσα στο Σαββατοκύριακο, έθεσε υπό σοβαρή αμφισβήτηση τις γιγάντιες αποτιμήσεις εταιρειών όπως η Nvidia, η οποία έχει ηγηθεί της παγκόσμιας «έκρηξης» των μετοχών AI, καθώς τα τσιπ της θεωρήθηκαν απαραίτητα για την τεχνολογία. Σημειώνεται ότι στις ηλεκτρονικές συναλλαγές πριν το άνοιγμα της Wall Street, η μετοχή του τεχνολογικού κολοσού Nvidia καταγράφει έως και «βουτιά» 10%.
Όπως αναφέρει το ΣΚΑΙ, «Η DeepSeek δείχνει ότι είναι εφικτή η ανάπτυξη ισχυρών μοντέλων τεχνητής νοημοσύνης με χαμηλότερο κόστος», δήλωσε ο Vey-Sern Ling, διευθύνων σύμβουλος της Union Bancaire Privee. «Αυτό μπορεί ενδεχομένως να εκτροχιάσει την επενδυτική αντίληψη για ολόκληρη την αλυσίδα εφοδιασμού τεχνητής νοημοσύνης».
Το προϊόν της DeepSeek «αμφισβητεί τις σημαντικές κεφαλαιουχικές δαπάνες και τα λειτουργικά έξοδα που έχει αναλάβει η Silicon Valley και είναι αυτός ο καταλληλότερος τρόπος προσέγγισης της τάσης της Τεχνητής Νοημοσύνης», δήλωσε ο Nirgunan Tiruchelvam, επικεφαλής του τμήματος καταναλωτών και διαδικτύου της Aletheia Capital με έδρα τη Σιγκαπούρη. «Θέτει υπό αμφισβήτηση τους τεράστιους πόρους που έχουν αφιερωθεί στην τεχνητή νοημοσύνη».
Στη χρηματιστηριακή αγορά των ΗΠΑ, τα futures του Nasdaq κατέγραψαν «βουτιά» έως και 5% και του S&P 500 έως και 2%. Απώλειες καταγράφουν και τα ευρωπαϊκά χρηματιστήρια, με τον τεχνολογικό κλάδο να καταγράφει πτώση 4%. Ο Nasdaq 100 και ο τεχνολογικός υποδείκτης του ευρωπαϊκού Stoxx 600 οδεύουν προς τη «διαγραφή» κεφαλαιοποίησης ύψους περίπου 1 τρισ. δολαρίων, αν οι απώλειες των αγορών συνεχιστούν.
Η πτώση των futures του Nasdaq έρχεται στην αρχή μιας μεγάλης εβδομάδας για τα εταιρικά αποτελέσματα των μεγάλων τεχνολογικών εταιρειών, όπως η Apple και η Microsoft. Η αύξηση των κερδών αναμένεται να έχει επιβραδυνθεί, ενώ οι αποτιμήσεις παραμένουν διογκωμένες, προκαλώντας για άλλη μια φορά ανησυχία για το μεγάλο ράλι του κλάδου με φόντο την τεχνητή νοημοσύνη. «Ενώ οι σημερινοί ηγέτες του χώρου, όπως η Nvidia, έχουν ισχυρή παρουσία στον χώρο, το γεγονός αυτό αποτελεί μια υπενθύμιση ότι η κυριαρχία της τεχνητής νοημοσύνης δεν μπορεί να θεωρηθεί δεδομένη», δήλωσε ο Charu Chanana, επικεφαλής επενδυτικός στρατηγικός αναλυτής της Saxo Markets. «Η εμφάνιση της κινεζικής DeepSeek δείχνει ότι ο ανταγωνισμός εντείνεται, και παρόλο που μπορεί να μην αποτελεί σημαντική απειλή τώρα, οι μελλοντικοί ανταγωνιστές θα εξελίσσονται ταχύτερα και θα αμφισβητούν πιο γρήγορα τις καθιερωμένες εταιρείες. Τα κέρδη αυτής της εβδομάδας θα αποτελέσουν μια τεράστια δοκιμασία».
Οι εισηγμένες στη Φρανκφούρτη μετοχές της Nvidia, της μεγαλύτερης εταιρείας παραγωγής chips για εφαρμογές ΑΙ στον κόσμο, υποχώρησαν περίπου 7% και ο ευρωπαϊκός δείκτης μετοχών Stoxx 50 κατρακύλησε 1,5% μετά το άνοιγμα της αγοράς.
Οι μετοχές των Tesla, Amazon και Meta υποχωρούσαν περισσότερο από 2% μετά την έναρξη της συνεδρίασης των ευρωπαϊκών χρηματιστηρίων.
Τα futures του Nasdaq 100 έκαναν βουτιά 2,6% και του S&P 500 κατά 1,4%, ενώ οι μετοχές του προμηθευτή της Nvidia, της Advantest, κατρακύλησαν 8,5% στο Τόκιο.
Τεχνολογική υπεροχή
Σε ένα σύνολο δοκιμών, το μοντέλο της DeepSeek ξεπέρασε το Llama 3.1 της Meta, το GPT-4o της OpenAI και το Claude Sonnet 3.5 της Anthropic σε ακρίβεια από την επίλυση σύνθετων προβλημάτων έως τα μαθηματικά και την κωδικοποίηση, σύμφωνα με το CNBC.
Η DeepSeek κυκλοφόρησε τη Δευτέρα και το r1, ένα μοντέλο συλλογισμού που επίσης ξεπέρασε το τελευταίο o1 της OpenAI σε πολλές από τις δοκιμές τρίτων.
«Βλέποντας το νέο μοντέλο DeepSeek, είναι εξαιρετικά εντυπωσιακό», δήλωσε ο διευθύνων σύμβουλος της Microsoft Satya Nadella στο Παγκόσμιο Οικονομικό Φόρουμ στο Νταβός της Ελβετίας την Τετάρτη. «Θα πρέπει να λάβουμε πολύ, πολύ σοβαρά στα υπόψη μας τις εξελίξεις από την Κίνα».
Η DeepSeek έπρεπε επίσης να ξεπεράσει τους αυστηρούς περιορισμούς στους ημιαγωγούς που έχει επιβάλει η κυβέρνηση των ΗΠΑ στην Κίνα, αποκόπτοντας τη χώρα από την πρόσβαση στα πιο ισχυρά τσιπ, όπως τα H100 της Nvidia. Οι τελευταίες εξελίξεις υποδηλώνουν ότι η DeepSeek είτε βρήκε τρόπο να παρακάμψει τους κανόνες, είτε ότι οι έλεγχοι εξαγωγών δεν ήταν ο ασφυκτικός κλοιός που επεδίωκε η Ουάσινγκτον.
Λίγα είναι γνωστά για το εργαστήριο και τον ιδρυτή του, Liang WenFeng. Το DeepSeek γεννήθηκε από ένα κινεζικό hedge fund με την ονομασία High-Flyer Quant που διαχειρίζεται περιουσιακά στοιχεία ύψους περίπου 8 δισ. δολαρίων, σύμφωνα με αναφορές των διεθνών μέσων ενημέρωσης.
Αλλά η DeepSeek δεν είναι η μόνη κινεζική εταιρεία που ξεχωρίζει στον κλάδο τεχνητής νοημοσύνης.
Ο κορυφαίος ερευνητής τεχνητής νοημοσύνης Kai-Fu Lee δήλωσε ότι η νεοσύστατη επιχείρησή του 01.ai εκπαιδεύτηκε χρησιμοποιώντας μόνο 3 εκατ. δολάρια. Η μητρική εταιρεία ByteDance της TikTok κυκλοφόρησε την Τετάρτη μια ενημερωμένη έκδοση του μοντέλου της που ισχυρίζεται ότι ξεπερνά το o1 της OpenAI σε μια βασική δοκιμή.
«Η ανάγκη είναι η μητέρα της εφεύρεσης», δήλωσε ο διευθύνων σύμβουλος της Perplexity Aravind Srinivas. «Επειδή έπρεπε να βρουν λύσεις, κατέληξαν να κατασκευάσουν κάτι πολύ πιο αποτελεσματικό».