Bardzo szybki rozwój sztucznej inteligencji oraz wykorzystywanie wielkich baz danych do tworzenia i ulepszania modeli sztucznej inteligencji może być powodem wielu problemów natury prawnej. Autorzy treści używanych do trenowania AI często nie dostają zapłaty oraz nie wymienia się ich nawet w źródłach. O problemach związanych z wykorzystywaniem sztucznej inteligencji pisze Polski Instytut Ekonomiczny (PIE).
Sztuczna inteligencja rodzi problemy z własnością intelektualną
Tworzenie modeli sztucznej inteligencji rodzi poważne wątpliwości dotyczące przestrzegania praw własności intelektualnej. Wymaga to dużych zbiorów danych, które często pochodzą z zewnętrznych źródeł, takich jak strony internetowe czy media społecznościowe, a ich pozyskiwanie bywa nieautoryzowane. Tego rodzaju praktyki budzą obawy o ich legalność, zwłaszcza w kontekście różnic w regulacjach prawnych między krajami. W efekcie, deweloperzy AI unikają ujawniania pochodzenia danych, co prowadzi do spadku przejrzystości w tej kwestii – raport OECD wskazuje, że w okresie od października 2023 r. do maja 2024 r. poziom transparentności spadł z 20 proc. do zaledwie 7 proc.
Brak jasności co do źródeł danych ma negatywne konsekwencje dla twórców treści, których prace są często wykorzystywane bez ich zgody. Utrudnia to ocenę, które dzieła zostały użyte i blokuje możliwość dochodzenia praw autorskich. Jak wynika z analizy CRFM, jedynie 1 na 14 modeli sztucznej inteligencji ujawnia informacje o twórcach danych i prawach licencyjnych.
Twórcy AI: nie powielanie a ich transformowanie
Amerykańskie firmy rozwijające sztuczną inteligencję twierdzą, że wykorzystanie chronionych danych do trenowania modeli AI jest legalne, ponieważ dane te są transformowane, a nie kopiowane. Argumentują, że swobodny dostęp do takich danych jest kluczowy dla utrzymania przewagi technologicznej USA, szczególnie w kontekście rywalizacji z Chinami. Jednocześnie są oskarżane o nielegalne pozyskiwanie danych, a lider rynku, OpenAI, oraz Meta, muszą stawić czoła pozwom o nieuprawnione wykorzystywanie chronionych treści, w tym książek czy publikacji naukowych, do trenowania modeli.
Niejednolite regulacje i międzynarodowy charakter przetwarzania danych sprawiają, że trudno jednoznacznie ocenić legalność takich praktyk. Niepewna sytuacja prawna sprzyja dużym firmom, które łatwiej omijają bariery regulacyjne, podczas gdy mniejsze podmioty napotykają na poważne trudności w rywalizacji w takich warunkach.