Ένα νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να κατανοήσει εικόνες και να πραγματοποιήσει πιο σύνθετες συνομιλίες από τα προηγούμενα προϊόντα της λάνσαρε η Alibaba, ενισχύονταν τις επενδύσεις της στη νεότευκτη αγορά, καθώς εντείνεται ο ανταγωνισμός σε αυτήν.
Ο κινεζικός τεχνολογικός κολοσσός, όπως μεταδίδει το CNBC, ανακοίνωσε ότι τα δύο νέα μοντέλα του, Qwen-VL και Qwen-VL-Chat, θα είναι ανοιχτού κώδικα — γεγονός που σημαίνει ότι ερευνητές, ακαδημαϊκοί και εταιρείες σε όλο τον κόσμο θα μπορούν να τα χρησιμοποιήσουν για να δημιουργήσουν τις δικές τους εφαρμογές AI χωρίς να χρειάζεται να εκπαιδεύσουν τα δικά τους συστήματα, εξοικονομώντας χρόνο και έξοδα.
Σύμφωνα με την Alibaba, το Qwen-VL μπορεί να απαντήσει σε ερωτήματα ανοιχτού τύπου που σχετίζονται με διαφορετικές εικόνες και να δημιουργήσει λεζάντες εικόνων.
Το Qwen-VL-Chat προχωρά σε μία πιο «σύνθετη αλληλεπίδραση», όπως η σύγκριση πολλαπλών εισόδων εικόνας και η απάντηση σε πολλούς γύρους ερωτήσεων. Ορισμένες εργασίες που μπορεί να εκτελέσει το Qwen-VL-Chat είναι η σύνταξη ιστοριών και η δημιουργία εικόνων με βάση φωτογραφίες που εισάγει ένας χρήστης, καθώς και η επίλυση μαθηματικών εξισώσεων που εμφανίζονται σε μια εικόνα.
Χαρακτηριστικό είναι το παράδειγμα που έδωσε η Alibaba με μία πινακίδα νοσοκομείου στην κινεζική γλώσσα. Το AI μπορεί να απαντήσει σε ερωτήσεις σχετικά με τις τοποθεσίες ορισμένων τμημάτων του νοσοκομείου ερμηνεύοντας την εικόνα της πινακίδας.
Μέχρι στιγμής, μεγάλο μέρος της γενετικής τεχνητής νοημοσύνης – όπου η τεχνολογία δημιουργεί αποκρίσεις με βάση τις ανθρώπινες εισροές – έχει επικεντρωθεί στην ανταπόκριση στο κείμενο. Η τελευταία έκδοση του ChatGPT του OpenAI έχει επίσης τη δυνατότητα να κατανοεί εικόνες και να απαντά σε κείμενο, όπως το Qwen-VL-Chat.
Τα δύο τελευταία μοντέλα της Alibaba βασίζονται στο μεγάλο γλωσσικό μοντέλο της εταιρείας που ονομάζεται Tongyi Qianwen, που κυκλοφόρησε νωρίτερα το 2023. Το LLM είναι ένα μοντέλο τεχνητής νοημοσύνης που εκπαιδεύεται σε τεράστιες ποσότητες δεδομένων και υποστηρίζει εφαρμογές chatbot.
Η εταιρεία με έδρα το Hangzhou αυτόν τον μήνα προμηθεύτηκε δύο άλλα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα. Αν και δεν κερδίζει τέλη αδειοδότησης από την Alibaba, η διανομή ανοιχτού κώδικα θα βοηθήσει την εταιρεία να αποκτήσει περισσότερους χρήστες για το μοντέλο τεχνητής νοημοσύνης της – τη στιγμή που το τμήμα cloud της εταιρείας δίνει έμαφαση στην ανάπτυξη, καθώς ετοιμάζεται να βγει στο χρηματιστήριο.