Η Authors Guild κατέθεσε ομαδική αγωγή κατά της OpenAI και στη δίκη παρουσιάστηκαν έγγραφα με βάση τα οποία η εταιρεία κατέστρεψε τεράστιο όγκο δεδομένων, τα οποία χρησιμοποίησε, για να εκπαιδεύσει το μοντέλο τεχνητής νοημοσύνης GPT-3, που θεωρείται το «μυαλό» του ChatGPT.
Πρόκειται για αρχεία με τα ονόματα «books1» και «books2», που περιλάμβαναν τουλάχιστον 100.000 βιβλία, τα οποία φέρεται να αξιοποίησε παράνομα η επιχείρηση, για να εκπαιδεύσει το γλωσσικό μοντέλο της δημοφιλούς εφαρμογής της, γιατί αρνήθηκε να πληρώσει πνευματικά δικαιώματα.
Η ιστοσελίδα «Business Insider» σε σχετικό δημοσίευμα ανέφερε πως σε εσωτερική ενημέρωση του 2020 η εταιρεία παραδεχόταν την ύπαρξη των παραπάνω δεδομένων, σημειώνοντας πως περιείχαν 67 δισεκατομμύρια λέξεις και ότι κατελάμβαναν το 16% της εκπαίδευσης. Ωστόσο, στα τέλη του 2021 σταμάτησε να τα χρησιμοποιεί και τα διέγραψε το 2022, όταν και ξεκίνησαν έρευνες εις βάρος της για το συγκεκριμένο ζήτημα.
Η OpenAI μέσω των δικηγόρων της επιβεβαίωσε την ύπαρξη και διαγραφή των «books1» και «books2», όμως ισχυρίστηκε ότι δεν αξιοποιήθηκαν στην εκπαίδευση του GPT-3. Αντιθέτως, ανέφερε πως δύο υπάλληλοι, που δεν θέλει να κατονομάσει, «προχώρησαν μόνοι τους σε δοκιμές», που τερματίστηκαν άμεσα και «χωρίς να επηρεάσουν» το τελικό προϊόν της.
Υπενθυμίζεται πως η απότομη άνοδος των μοντέλων τεχνητής νοημοσύνης δημιούργησε υπόνοιες για τον τρόπο κατασκευής, ειδικά από τη στιγμή που υπήρχε ελεύθερη πρόσβαση, δηλαδή απουσίαζε μια άμεση πηγή κέρδους.
Ορισμένοι θεωρούν πως οι εταιρείες αξιοποίησαν πνευματικό υλικό (βιβλία, μελέτες κτλ), για να εκπαιδεύσουν το «μυαλό» των AI χωρίς να πληρώσουν τους νόμιμους ιδιοκτήτες, ισχυριζόμενες πως οι μηχανές έγιναν πιο έξυπνες από την καθημερινή επαφή με τους χρήστες του διαδικτύου.