Η OpenAI ανακοίνωσε πρόσφατα σημαντικές ενημερώσεις στο δημοφιλές ChatGPT, οι οποίες του επιτρέπουν πλέον να βλέπει, να ακούει και να μιλάει. Αυτές οι νέες δυνατότητες, που τροφοδοτούνται από τα γλωσσικά μοντέλα GPT 3.5 και GPT 4, προσφέρουν μια πιο διαισθητική και διαδραστική εμπειρία για τους χρήστες σύμφωνα με την εταιρεία.
Το ChatGPT μπορεί πλέον να κατανοεί προφορικά ερωτήματα σε απλή γλώσσα, να απαντά με μία από τις πέντε διαφορετικές φωνές και ακόμη και να παρέχει απαντήσεις με βάση τις εικόνες που έχουν μεταφορτωθεί.
Οι χρήστες μπορούν πλέον να μιλούν στο ChatGPT και αυτό θα ανταποκρίνεται με ανθρώπινη φωνή, χάρη σε ένα νέο μοντέλο μετατροπής κειμένου σε ομιλία. Αυτή η δυνατότητα είναι παρόμοια με αυτές που προσφέρονται από φωνητικούς βοηθούς όπως η Alexa της Amazon και η Siri της Apple, αλλά η υποκείμενη τεχνολογία του ChatGPT του επιτρέπει να ανταποκρίνεται πιο δυναμικά.
Εκτός από τις φωνητικές δυνατότητες, το ChatGPT μπορεί πλέον να ανταποκρίνεται και σε εικόνες. Οι χρήστες μπορούν να ανεβάσουν εικόνες και το chatbot θα παρέχει σχετικές πληροφορίες ή θα απαντά σε ερωτήσεις με βάση το περιεχόμενο της εικόνας. Αυτή η λειτουργία είναι ιδιαίτερα χρήσιμη για εργασίες όπως η αναγνώριση αντικειμένων, η ανάλυση εικόνων ή η δημιουργία κειμένου βάσει της οπτικής εισόδου.
Η ενημερωμένη έκδοση του ChatGPT θα είναι διαθέσιμη σε χρήστες Plus και Enterprise τις επόμενες δύο εβδομάδες. Οι δυνατότητες φωνής θα είναι διαθέσιμες σε πλατφόρμες iOS και Android, ενώ η υποστήριξη εικόνας θα είναι διαθέσιμη σε όλες τις πλατφόρμες.