Θέση μάχης απέναντι στους ισχυρούς «κολοσσούς» της τεχνολογίας – Microsoft, Google, Meta και Open AI παίρνει η Amazon, λανσάροντας στο ετήσιο συνέδριο της, ReInvent 2024, που πραγματοποιείται αυτές τις ημέρες στο Λας Βέγκας, το δικό της foundational model, ονόματι Amazon Nova.
Με τέσσερις εκδοχές, Micro, Lite, Pro και Premier, τρεις από τις οποίες είναι ήδη διαθέσιμες στο κοινό, η Amazon Web Services, φιλοδοξεί να ηγηθεί των gen AI εργαλείων επεξεργασίας για επιχειρήσεις, και να βοηθήσει κάθε «ενδιαφερόμενο να καινοτομήσει», όπως ανέφερε ο CEO της Amazon, Andy Jassy από το βήμα του ετήσιου συνεδρίου στο Λας Βέγκας.
Σύμφωνα με την TechCrunch, Τα Micro, Lite και Pro είναι διαθέσιμα από χθες Τρίτη (03/12), στους πελάτες της AWS, ενώ το Premier θα βγει στην αγορά στις αρχές του 2025, δήλωσε ο διευθύνων σύμβουλος της Amazon, Andy Jassy.
Εκτός από αυτά, υπάρχει ένα μοντέλο δημιουργίας εικόνων, το Nova Canvas, και ένα μοντέλο δημιουργίας βίντεο, το Nova Reel. Και τα δύο είναι ήδη διαθέσιμα στο κοινό.
«Συνεχίσαμε να δουλεύουμε πάνω στα δικά μας μοντέλα», δήλωσε ο Jassy, προσθέτοντας ότι και αυτά τα οριακά μοντέλα έχουν σημειώσει τεράστια πρόοδο τους τελευταίους τέσσερις με πέντε μήνες. Και σκεφτήκαμε ότι, αν εμείς βρήκαμε αξία σε αυτά, πιθανότατα θα βρείτε κι εσείς».
Micro, Lite, Pro και Premier
Τα μοντέλα Amazon Nova, είναι βελτιστοποιημένα για 15 γλώσσες (αλλά κυρίως για τα αγγλικά) και παρουσιάζουν διαφορετικές δυνατότητες μεταξύ τους.
Το Micro μπορεί να δεχτεί μόνο κείμενο αλλά υπόσχεται πολύ χαμηλό latency, μεταξύ των τεσσάρων, επιτυγχάνοντας να επεξεργαστεί και να παράξει κείμενο στον ταχύτερο δυνατό χρόνο σε πολύ χαμηλό κόστος.
Η γρήγορη ταχύτητα είναι η ειδοποιός διαφορά και του Amazon Nova Lite, του έτερου πολυτροπικού μοντέλου χαμηλού κόστους που παρουσίασε η εταιρεία το οποίο μπορεί να επεξεργαστεί κείμενο, εικόνες και βίντεο.
Όσο για το Pro προσφέρει έναν ισορροπημένο συνδυασμό ακρίβειας, ταχύτητας και κόστους για μια σειρά εργασιών.
Και το Premier τέλος, είναι το πιο ικανό από τα τέσσερα. Ένα AI εργαλείο επεξεργασίας σχεδιασμένο για πολύπλοκες εργασίες, το οποίο αναμένεται εντός του 2025.
Τα Pro και Premier, όπως και το Lite, μπορούν να αναλύουν κείμενο, εικόνες και βίντεο. Και τα τρία είναι κατάλληλα για εργασίες, όπως η επεξεργασία εγγράφων και η σύνοψη συναντήσεων και διαγραμμάτων. Στην περίπτωση του Premier, ωστόσο, σύμφωνα με την Amazon προορίζεται για να δημιουργεί το ίδιο άλλα μοντέλα, παρά για να χρησιμοποιείται αυτούσιο.
Ειδοποιός διαφορά των συγκεκριμένων μοντέλων, όπως επεσήμαναν τα στελέχη της Amazon, είναι ότι δημιουργήθηκαν λαμβάνοντας υπόψη την υστέρηση που παρουσιάζουν άλλες αντίστοιχες εφαρμογές.
«Μέσα στην Amazon, έχουμε περίπου 1.000 εφαρμογές γεννητικής τεχνητής νοημοσύνης σε εξέλιξη και έχουμε αποκτήσει μια πανοραμική εικόνα για τα ζητήματα που ακόμα αντιμετωπίζουν οι δημιουργοί εφαρμογών», δήλωσε ο Rohit Prasad, Ανώτερος Αντιπρόεδρος του Amazon Artificial General Intelligence.
«Τα νέα μας μοντέλα Amazon Nova προορίζονται να αντιμετωπίσουν αυτές τις προκλήσεις προσφέροντας μια πολύ καλή σχέση κόστους-αποτελεσματικότητας.»
Πώς λειτουργούν τα μοντέλα Canvas και Reel
Το Canvas και το Reel είναι τα ισχυρά «χαρτιά» της AWS για τα δημιουργικά μέσα.
Το Canvas επιτρέπει στους χρήστες να δημιουργούν και να επεξεργάζονται εικόνες χρησιμοποιώντας βοηθητικές λειτουργίες (π.χ. για την αφαίρεση φόντου) και παρέχει έλεγχο για τα χρωματικά σχήματα και τις διατάξεις των παραγόμενων εικόνων.
Το Reel, το πιο φιλόδοξο από τα δύο μοντέλα, δημιουργεί βίντεο έως έξι δευτερολέπτων. Χρησιμοποιώντας το, οι χρήστες μπορούν να ρυθμίσουν την κίνηση της κάμερας για να δημιουργήσουν βίντεο με πανοραμικές κινήσεις, περιστροφές 360 μοιρών και ζουμ.
Επίσης, το Reel, περιορίζεται επί του παρόντος σε βίντεο έξι δευτερολέπτων (που χρειάζονται περίπου τρία λεπτά για να δημιουργηθούν), αλλά μια έκδοση που μπορεί να δημιουργήσει βίντεο διάρκειας δύο λεπτών «έρχεται σύντομα», σύμφωνα με την AWS.
Ο Jassy υπογράμμισε ότι τόσο το Canvas όσο και το Reel διαθέτουν «ενσωματωμένους» ελέγχους για υπεύθυνη χρήση. «Προσπαθούμε να περιορίσουμε τη δημιουργία επιβλαβούς περιεχομένου», δήλωσε.
Η AWS επέκτεινε τις διασφαλίσεις σε μια ανάρτηση στο blog, λέγοντας ότι η Nova «επεκτείνει τα μέτρα ασφαλείας για την καταπολέμηση της διάδοσης παραπληροφόρησης, υλικού σεξουαλικής κακοποίησης παιδιών και χημικών, βιολογικών, ραδιολογικών ή πυρηνικών κινδύνων».
Ωστόσο, δεν είναι σαφές τι σημαίνει αυτό στην πράξη – ή ποιες μορφές λαμβάνουν αυτά τα μέτρα.
Τι αναμένεται το 2025
Παράλληλα, ένα μοντέλο speech-to-speech και ένα native multimodal-to-multimodal μοντέλο προγραμματίζονται για αργότερα το 2025.
Οι ανακοινώσεις έγιναν στο συνέδριο AWS ReInvent, στο Λας Βέγκας, όπου η Amazon αποκάλυψε και την ανάπτυξη ενός τεράστιου υπολογιστικού κέντρου AI με τη χρήση των Trainium 2 chips, σε συνεργασία με την Anthropic, στην οποία έχει επενδύσει 8 δισ. δολάρια. Αυτό το κέντρο αναμένεται να είναι το μεγαλύτερο παγκοσμίως για AI.
«Θα μπορείτε να εισάγετε κείμενο, ομιλία, εικόνες ή βίντεο και να εξάγετε κείμενο, ομιλία, εικόνες ή βίντεο», δήλωσε ο Jassy για το μοντέλο any-to-any, κάνοντας λόγο για επεξεργασία χωρίς σύνορα.