Pod koniec marca 2025 r. magazyn „The Atlantic” ujawnił dokumenty z amerykańskiego sądu, który rozpatruje sprawę użycia przez koncern Meta milionów spiraconych książek do nauki sztucznej inteligencji AI. Gdy pracownicy koncernu zaczęli pracować nad Llama 3 (nowym modelem AI), musieli przeszkolić algorytm tekstami wysokiej jakości, by była konkurencyjna wobec ChatGPT. Mark Zuckerberg zatwierdził korzystanie z LibGen (skrót od „Library Genesis”), nielegalnego repozytorium plików, które było źródłem treści wykorzystywanych do trenowania modelu. Koncern Meta twierdzi, że masowe zbieranie danych mieści się w definicji „dozwolonego użytku”. Sprawę opisuje Wojciech Szot w „Gazecie Wyborczej”.
Zgodnie z informacjami dziennikarzy „The Atlantic”, Mark Zuckerberg, dyrektor generalny Mety, zatwierdził korzystanie z nielegalnego repozytorium plików LibGen. To stworzony w Rosji system, w którym znajduje się ponad 7,5 mln plików z książkami i 81 mln plików z pracami badawczych a jednocześnie jedna z największych pirackich bibliotek na świecie. Zdaniem dziennikarzy „The Atlantic” pracownicy Mety rozmawiali wcześniej z wieloma firmami o zakupie licencji do książek jednak efekty były niezadowalające. „Wydaje mi się to nieracjonalnie drogie” – napisał jeden z pracowników na czacie firmy.
Zgodnie z prawem autorskim wolno korzystać z już rozpowszechnionego utworu w zakresie „własnego użytku osobistego” bez posiadania licencji. Możemy kupioną książkę zeskanować na własny użytek, ale skanu nie możemy udostępniać. „The Atlantic” udostępnił wyszukiwarkę, w której można znaleźć tytułu książek i materiałów, które mogły być wykorzystane do szkolenia AI o nazwie Llama 3. Baza pochodzi ze stycznia 2025 r. i są w niej także książki polskich twórców, zarówno oryginały, jak i przekłady. Znaleźć można w niej książki Doroty Masłowskiej, Szczepana Twardocha, czy Olgi Tokarczuk.
Francuscy wydawcy i autorzy w marcu 2025 r. ogłosili, że zamierzają pozwać Metę o „nieprzestrzeganie praw autorskich i pasożytnictwo”. Jak podkreślają polscy pisarze z którymi rozmawiała „Wyborcza”, polski rząd zupełnie nie interesuje się skalą piractwa książek.
Więcej w artykule na stronie Wyborcza.pl.