Η διαδικτυακή πλατφόρμα δημοσιεύσεων Medium ανακοίνωσε ότι θα μπλοκάρει το GPTBot της OpenAI, ένα εργαλείο online που σκανάρει ιστοσελίδες και συγκεντρώνει περιεχόμενο που χρησιμοποιείται για την εκπαίδευση των μοντέλων AI της εταιρείας.
Ωστόσο, η πραγματική είδηση μπορεί να είναι ότι μια ομάδα πλατφορμών μπορεί σύντομα να σχηματίσει ένα ενιαίο μέτωπο ενάντια σε αυτό που πολλοί θεωρούν εκμετάλλευση του περιεχομένου τους. Το Medium μαζί με το CNN, τους New York Times και πολλά άλλα μέσα ενημέρωσης προσθέτουν το “User-Agent: GPTBot” στη λίστα των απαγορευμένων agents στο γνωστό αρχείο robots.txt στους servers τους. Πρόκειται για ένα έγγραφο που βρίσκεται σε πολλούς ιστότοπους και ενημερώνει τα αυτοματοποιημένα προγράμματα ανίχνευσης και ευρετηρίασης των μηχανών αναζήτησης που σαρώνουν συνεχώς το web, ότι ο εκάστοτε ιστότοπος συναινεί στη σάρωση ή όχι.
Οι κατασκευαστές τεχνητής νοημοσύνης κάνουν περισσότερα από το να ευρετηριάζουν φυσικά: συλλέγουν δεδομένα για να χρησιμοποιηθούν ως αρχικό υλικό για τα μοντέλα τους. Λίγοι είναι ευχαριστημένοι με αυτό, και σίγουρα όχι ο διευθύνων σύμβουλος της Medium, Tony Stubblebine, ο οποίος γράφει σχετικά: «Δεν είμαι οπαδός των εταιρειών τεχνητής νοημοσύνης που συλλέγουν το περιεχόμενό μας για να εκπαιδεύσουν τα μοντέλα τους. Δεν λέω ότι είμαι εναντίον της τεχνητής νοημοσύνης, αλλά ότι είμαι υπέρ της αξίας της δουλειάς των συγγραφέων».
Η απόφαση του Stubblebine να μπλοκάρει τον scraper της OpenAI είναι μια προσπάθεια να προστατεύσει την αξία του έργου των συγγραφέων και να αποτρέψει τις πλατφόρμες AI να συλλέγουν δεδομένα χωρίς την συγκατάθεσή τους, κάτι βέβαια που θα μπορεί να γίνει μετά από κάποια αποζημίωση.