Σε μια προσπάθεια να μειώσει το λειτουργικό κόστος και να ενισχύσει την αποδοτικότητα, η ανερχόμενη κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek συνεργάζεται με το Πανεπιστήμιο Tsinghua. Στόχος της συμμαχίας είναι η ανάπτυξη νέων μεθόδων εκπαίδευσης που απαιτούν λιγότερους πόρους, χωρίς όμως να γίνονται εκπτώσεις στην ποιότητα των αποτελεσμάτων.
Η DeepSeek, που αναστάτωσε τη διεθνή αγορά τον Ιανουάριο παρουσιάζοντας ένα μοντέλο συλλογιστικής χαμηλού κόστους, επιστρέφει στο προσκήνιο. Αυτή τη φορά, με μια καινοτόμα προσέγγιση στην ενισχυτική μάθηση, που επιβραβεύει τα μοντέλα τεχνητής νοημοσύνης όταν δίνουν πιο ακριβείς και κατανοητές απαντήσεις – ευθυγραμμισμένες με τις ανθρώπινες προτιμήσεις.
Η νέα στρατηγική, την οποία οι ερευνητές αποκαλούν «ρύθμιση κριτικής βάσει αρχών», ξεπέρασε τα υπάρχοντα συστήματα σε δοκιμασίες απόδοσης, χρησιμοποιώντας λιγότερους υπολογιστικούς πόρους. Το αποτέλεσμα είναι το DeepSeek-GRM (Generalized Reward Modeling), το οποίο η εταιρεία ανακοίνωσε ότι θα διαθέσει σε ανοιχτό κώδικα.
Η κινεζική startup με έδρα το Hangzhou ενισχύει τη θέση της στον παγκόσμιο χάρτη της ΑΙ, δίπλα σε τεχνολογικούς κολοσσούς όπως η Meta, η OpenAI και η Alibaba. Η Meta, μάλιστα, σύγκρινε πρόσφατα τη νέα γενιά μοντέλων της (Llama 4) με αυτά της DeepSeek, αναδεικνύοντας την αξία της τεχνολογίας Mixture of Experts (MoE), που χρησιμοποιούν και οι δύο.
Η DeepSeek δεν έχει ακόμη ανακοινώσει την ημερομηνία κυκλοφορίας του επόμενου «ναυαρχίδας» μοντέλου της, αλλά όλα δείχνουν πως η μάχη της καινοτομίας στην τεχνητή νοημοσύνη μόλις αρχίζει – και η Κίνα διεκδικεί πρωταγωνιστικό ρόλο.