Słuchajcie, w świecie sztucznej inteligencji właśnie wybuchła prawdziwa bomba. Nvidia, ta sama firma, której karty graficzne napędzają rewolucję AI i która zarabia na tym miliardy, ma teraz na głowie poważny problem prawny. Okazuje się, że w pogoni za danymi do trenowania swoich modeli, gigant mógł posunąć się za daleko – nawiązując bezpośredni kontakt z pirackim serwisem Anna’s Archive.
Do tej pory wiedzieliśmy, że firmy technologiczne „zasysają” internet, żeby uczyć swoje modele. Ale najnowsze dokumenty sądowe sugerują, że Nvidia nie tylko „przypadkiem” skorzystała z pirackich źródeł, ale celowo o nie zabiegała. To trochę tak, jakby szef kuchni ekskluzywnej restauracji kupował składniki z kradzionej ciężarówki, bo w sklepie były za drogie.
„Zdesperowani w poszukiwaniu książek”
Wszystko wyszło na jaw dzięki pozwowi zbiorowemu, który autorzy książek wytoczyli Nvidii. Pisarze tacy jak Abdi Nazemian czy Brian Keene oskarżają firmę o bezprawne wykorzystanie ich twórczości. Ale to, co znaleziono w wewnętrznych mailach firmy, to prawdziwy hit.
Z dokumentów wynika, że pracownicy Nvidii z zespołu ds. strategii danych skontaktowali się z administratorami Anna’s Archive – jednego z największych i najbardziej znanych serwisów z pirackimi e-bookami na świecie. Cel? Uzyskać „szybki dostęp” do milionów książek, żeby nakarmić nimi swoje modele językowe (LLM), takie jak NeMo.
W pozwie pada mocne zdanie: „Zdesperowana w poszukiwaniu książek, Nvidia skontaktowała się z Anna’s Archive (…) w sprawie pozyskania milionów pirackich materiałów”. Co więcej, piraci podobno zażądali dziesiątek tysięcy dolarów za taki „dostęp premium”, a Nvidia… zaczęła dopytywać o szczegóły.
Piraci ostrzegali: „To nielegalne”. Nvidia: „Dajemy zielone światło”
To brzmi jak scenariusz filmu, ale według pozwu, sami administratorzy Anna’s Archive zachowali się uczciwiej niż korporacja. Ostrzegli Nvidię, że ich zbiory są pozyskane nielegalnie i zapytali, czy firma ma zgodę „z góry” na takie ryzykowne działanie.
Odpowiedź Nvidii? Według autorów pozwu, kadra zarządzająca potrzebowała zaledwie tygodnia, by dać „zielone światło” na piractwo. W efekcie firma miała uzyskać dostęp do około 500 terabajtów danych, w tym milionów książek, które normalnie są chronione prawem autorskim.
Dlaczego Nvidia ryzykowała?
Odpowiedź jest prosta: presja konkurencji. W wyścigu o stworzenie najlepszej sztucznej inteligencji, dane są nowym złotem. Książki są szczególnie cenne, bo zawierają wysokiej jakości tekst, który uczy AI logicznego myślenia i kreatywności.
- Oszczędność czasu i pieniędzy – legalne licencjonowanie milionów tytułów trwałoby lata i kosztowało fortunę.
- Konkurencja nie śpi – inne firmy też szukają danych, a Nvidia chciała być pierwsza i najlepsza.
Oprócz Anna’s Archive, firma jest oskarżana o korzystanie z innych pirackich źródeł, takich jak LibGen, Sci-Hub czy Z-Library.
Co to oznacza dla nas?
Ta sprawa może zmienić zasady gry. Jeśli sąd uzna, że Nvidia świadomie łamała prawo, kary mogą być gigantyczne. Dla autorów to walka o przetrwanie – nie chcą, by ich praca była „mielona” przez maszyny bez żadnego wynagrodzenia. Dla Nvidii to wizerunkowa katastrofa, która pokazuje, że za lśniącą fasadą AI kryją się czasem brudne zagrywki.
Na razie Nvidia broni się twierdząc, że trenowanie AI to „dozwolony użytek”, bo modele nie kopiują książek 1:1, a jedynie uczą się z nich statystyk języka. Ale czy sąd uwierzy w to tłumaczenie, widząc maile z negocjacjami z piratami? Zobaczymy.
