Blog

Text And Data Mining (TDM) – Zasady Dozwolonego Użytku

Tomasz Grot
Autor
15.07.2025
Data dodania
  • TDM
  • opt out
  • komputerowa analiza danych
  • startup
  • prawo autorskie
  • Text And Data Mining
  • uczenie maszynowe
  • modele AI
  • Dyrektywa DSM
  • licencja prawo autorskie
  • AI
  • sztuczna inteligencja

W 2024 roku w Polsce weszły w życie długo oczekiwane przepisy regulujące legalne wykorzystywanie cudzych utworów w ramach eksploracji tekstów i danych (Text and Data Mining — TDM). Nowe regulacje są istotne dla firm rozwijających sztuczną inteligencję, startupów, instytucji naukowych oraz podmiotów analizujących dane na masową skalę. W artykule wyjaśniamy, kto i na jakich zasadach może dziś korzystać z TDM, jakie ryzyka się z tym wiążą oraz jak przygotować się do zmian, by działać zgodnie z prawem i chronić własne interesy.

Text and Data Mining (TDM) – implementacja do prawa polskiego

Ubiegły rok przyniósł długo wyczekiwaną implementację do prawa polskiego dwóch unijnych dyrektyw, z których jedna Dyrektywa 2019/790 w sprawie w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym oraz zmiany dyrektyw 96/9/WE i 2001/29/WE (Dyrektywa DSM), dotyczy dozwolonego wykorzystywania utworów na potrzeby eksploracji tekstów i danych (uczenia maszynowego).  Polska nowe przepisy wdrożyła jako ostatnie państwo członkowskie UE z 2,5 rocznym opóźnieniem. Po blisko roku obowiązywania nowych przepisów, możemy spojrzeć z perspektywy na skutki tych regulacji.

Wprowadzone przepisy mają duże znaczenie dla branży zajmującej się analizą danych, rozwijaniem i wykorzystywaniem modeli sztucznej inteligencji, ale także dla prac badawczych i rozwojowych, dla uczelni wyższych czy startupów. TDM umożliwia bowiem maszynowe przetwarzanie ogromnych ilości tekstów, obrazów, czy innych danych, w celu wyszukiwania i tworzenia wzorców, trenowania i uczenia modeli AI czy analizy tych danych. Do momentu wdrożenia nowych przepisów, zasady wykorzystywania tych wszystkich danych, stanowiących cudze utwory nie były w Polsce klarowne. Pytanie, czy nowe przepisy przyniosły skuteczne rozwiązania?

Nowelizacja ustawy o prawie autorskim i prawach pokrewnych otworzyła drzwi do legalnego (pod pewnymi warunkami) wykorzystywania – eksplorowania cudzych tekstów i danych.

Warto wskazać, że AI Act (rozporządzenie unijne), od 2 sierpnia 2025 toku będzie wymagało od dostawców modeli AI ogólnego przeznaczenia posiadania polityki zapewniającej zgodność z prawem Unii dotyczącym prawa autorskiego i praw pokrewnych, w szczególności prawidłowego rozpoznawania i stosowania się do zastrzeżenia opt-out, o którym mowa w dyrektywie DSM i polskiej ustawie.

Text and Data Mining – co umożliwiają nowe przepisy?

Nowelizacja prawa autorskiego w zakresie TDM polegała na wprowadzeniu dwóch prawnie dopuszczalnych reżimów pozwalających na stosowanie TDM z wykorzystaniem utworów objętych prawami autorskimi. Generalnie zatem są to prawnie dopuszczalne dwa nowe wyjątki od ochrony autora i jego autorskich praw majątkowych, czyli nowe warianty prawnie dozwolonego użytku chronionych utworów.

Ustawa i dyrektywa posługuje się definicją prawną TDM jako eksploracją tekstów i danych, rozumianą jako analiza wyłącznie przy zastosowaniu zautomatyzowanej techniki służącej do analizowania tekstów i danych w postaci cyfrowej w celu wygenerowania określonych informacji, obejmujących w szczególności wzorce, tendencje i korelacje.

1. Wyjątek badawczy

Nowy art. 262 ustawy o prawach autorskich umożliwia prowadzenie TDM przez instytucje dziedzictwa kulturowego oraz niektóre instytucje systemu szkolnictwa wyższego takie jak na przykład uczelnie, instytucje naukowe PAN, instytuty badawcze, instytuty działające w ramach sieci badawczej Łukasiewicz, czy inne podmioty prowadzące głównie działalność naukową w sposób samodzielny i ciągły.

 Na jakich warunkach podmioty naukowe mogą prowadzić TDM?

  • muszą posiadać legalny dostęp do wykorzystywanych utworów;
  • wykorzystywanie nie może mieć charakteru komercyjnego, czyli musi służyć wyłącznie celom badań naukowych i a nie osiągnieciu korzyści majątkowych;
  • właściciel autorskich praw majątkowych nie może się sprzeciwić takiemu wykorzystywaniu utworu;
  • wykorzystywane utwory mogą być przechowywane do celów badań i weryfikacji ich wyników, z zachowaniem bezpieczeństwa dostępu do tych utworów wyłącznie upoważnionym osobom, z uwzględnieniem procedur uwierzytelniających.
2. Wyjątek komercyjny

Drugi wyjątek (art. 263) pozwala na stosowanie TDM również w celach komercyjnych, co jest kluczowe dla firm.

Na jakich warunkach firmy komercyjne mogą prowadzić TDM?

  • muszą posiadać legalny dostęp do wykorzystywanych rozpowszechnionych już utworów, np. publicznie udostępnione zbiory,  artykuły, dane lub bazy danych objęte subskrypcją albo wykupioną licencją;
  • brak zastrzeżenia uprawnionego do wykonywania autorskich praw majątkowych o sprzeciwie (opt-out). W tym przypadku uprawniony może zastrzec, że nie wyraża zgody, by utwór był eksplorowany. Takie zastrzeżenie także musi spełniać określone warunki. Jeśli takie zastrzeżenie ma miejsce, to firma nie może wykorzystywać takich danych do TDM. Sprzeciw musi być wyrażony w sposób jasny, widoczny i maszynowo odczytywalny – odpowiednio do sposobu w jaki został udostępniony, na przykład w pliku robots.txt, metadanych strony lub w regulaminie serwisu. Zatem zgoda na wykorzystanie w celach przetwarzania maszynowego jest dorozumiana.
  • wykorzystywane utwory mogą być przechowywane wyłącznie w celu TDM i tylko w przez okres do tego konieczny.

Text and data Mining – co nowe regulacje oznaczają w praktyce dla firm i organizacji?

Obowiązujące przepisy mają praktyczne znaczenie dla podmiotów wykorzystujących TDM. O ile instytucje naukowe i badawcze operujące w ramach pierwszego z opisanych wyjątków, muszą zadbać właściwie tylko o legalność dostępu do źródeł, to firmy komercyjne oprócz tego powinny się skupić na weryfikacji, czy źródła danych, które mają zamiar wykorzystać nie są obarczone zastrzeżeniem, uniemożliwiającym ich wykorzystanie.

O legalność i prawidłowość TDM powinny zadbać przede wszystkim:

Startupy AI, zwłaszcza te trenujące modele językowe (LLM), które potrzebują ogromnych zbiorów tekstowych

Firmy analizujące dane z sieci — np. monitorujące trendy w social mediach, analizujące komentarze użytkowników.

Portale agregujące treści z wielu źródeł i przygotowujące raporty lub rekomendacje.

Narzędzia Business Intelligence (BI) i zespoły data science pracujące nad automatyzacją analiz.

Agencje marketingowe, które monitorują działania konkurencji lub analizują treści medialne.

Text and Data Mining a ryzyka i pułapki – kiedy warto skorzystać z pomocy prawnika?

Text and Data Mining (TDM) to potężne narzędzie analityczne, które staje się codziennością w pracy firm technologicznych, badawczych i medialnych. Jednak w miarę jak rośnie jego popularność, zwiększa się również liczba prawnych niejasności i potencjalnych ryzyk. Od niejednoznacznych reguł opt-out, przez ograniczenia licencyjne, po konflikt z przepisami RODO — brak ostrożności może skutkować poważnymi konsekwencjami. Kluczowe staje się zrozumienie, w jakich sytuacjach TDM jest legalne, a kiedy może prowadzić do naruszeń prawa. W takich przypadkach warto skorzystać z pomocy prawnika, zanim jeszcze pojawią się roszczenia.

Brak jednolitych standardów opt-out

Przepisy wymagają, aby sprzeciw był wyraźny i odpowiedni. W przypadku utworów publicznie udostępnionych o dostępie w wybranym miejscu i czasie dodatkowo „maszynowo odczytywalny”. Brak jednak jednolitego wzoru czy formatu takiego zastrzeżenia. W efekcie firmy mogą mieć trudności z interpretacją zapisów i ryzykują naruszenie praw autorskich. Czy zastrzeżenie jest wadliwe i forma może wykorzystać dane? A może na odwrót, czy wystarczająco dobrze sformułowaliśmy nasz opt-out i skutecznie chronimy nasze dane?

Ryzyko naruszenia licencji

Wiele serwisów internetowych ogranicza sposób korzystania z ich treści. Nawet jeśli formalnie dostęp jest publiczny, regulamin może zawierać postanowienia zabraniające scrapingu lub TDM. Naruszenie takich zapisów może skutkować roszczeniami o odszkodowanie lub rozwiązanie umowy.

Potrzeba własnych polityk Text and Data Mining

Firmy, które same udostępniają treści (np. portale informacyjne, bazy danych), powinny przygotować własne polityki TDM, aby jasno określić, czy wyrażają zgodę na eksplorację, czy też chcą skorzystać z prawa sprzeciwu. To istotne narzędzie ochrony własnych danych. W interesie firm korzystających z TDM jest zadbanie o rzetelne dokumentowanie eksplorowanych danych, by bronić się przed roszczeniami ich właścicieli.

Konflikt z RODO i tajemnicą przedsiębiorstwa

Jeśli eksplorowane dane zawierają informacje osobowe, należy dodatkowo uwzględnić wymogi RODO, m.in. zasadę minimalizacji danych, podstawy prawne przetwarzania oraz obowiązki informacyjne wobec osób, których dane są przetwarzane. Dodatkowym wyzwaniem jest ochrona poufnych informacji objętych tajemnicą przedsiębiorstwa.

Text and Data Mining – FAQ

Czy można legalnie pobrać treści z serwisu i analizować je maszynowo?

Jeśli serwis jest dostępny publicznie – co do zasady tak. Upewnij się, że właściciel serwisu nie zastrzegł zakazu TDM.

Jak sprawdzić, czy w ramach Text and Data Mining właściciel treści skutecznie wyłączył zgodę?

Zastrzeżenie musi być wyraźne i odpowiednie do sposobu w jaki treści zostały udostępnione. Trywialny przykład: e-book – zastrzeżenie w treści pliku. W przypadku serwisu internetowego sprawdzenie metadanych strony powinno być podstawową praktyką. Dodatkowo warto przeanalizować warunki korzystania.

Jak wdrożyć Text and Data Mining zgodnie z prawem?

Prowadź rejestr wykorzystywanych źródeł. Wskazuj i przechowuj dokumentację (o ile taka istnieje) legalności ich posiadania. Rejestruj datę pobrania i czas przechowania. Zadbaj o wzmiankę  o braku opt-outu. Opisz sposób i cel wykorzystania (np. .analiza danych, uczenie modelu).

Co z danymi, do których mam licencję w kontekście Text and Data Mining?

Licencja czy sublicencja to prawo do korzystania z utworu na konkretnych zasadach i polach eksploatacji. Należy przeanalizować warunki jej udzielenia i ograniczenia do wykorzystywania w celach TDM. Umowy mogą przewidywać dodatkowe warunki np. opłaty.

Text and Data Mining – prawnik prawo autorskie

Jeśli chcesz bezpiecznie korzystać z TDM, albo chcesz zabezpieczyć swoje dane przed nieuprawnionych ich wykorzystaniem warto się do tego odpowiednio przygotować.

Pomożemy ocenić, czy dane gromadzone w ramach TDM są zgodne z obowiązującymi przepisami prawa autorskiego i prawa ochrony danych. W razie potrzeby przygotujemy rekomendacje zmian. Oferujemy wsparcie w opracowaniu dokumentów, które formalizują korzystanie z TDM.

Pomagamy właścicielom treści wdrożyć skuteczne mechanizmy wyrażania sprzeciwu wobec TDM, zgodnie z wymogami technicznymi i prawnymi.

Specjalizacje w tym wpisie:

Zobacz także:

22.04.2025

Czy można wykorzystywać treści generowane przez AI? Prawo,…

W dzisiejszych czasach wykorzystywanie sztucznej inteligencji w branży kreatywnej, marketingowej, IT czy e-commerce stało się już niemal standardem. Narzędzia takie jak…

09.04.2025

Jak przygotować się do podpisania umowy z firmą…

Realizacja projektu IT, czy to wdrożenie systemu ERP, platformy CRM, zaawansowanej platformy e-commerce, systemu do zarządzania magazynem (WMS), dedykowanego oprogramowania produkcyjnego…

03.03.2025

AI Act w praktyce – jak bezpiecznie korzystać…

Sztuczna inteligencja dynamicznie zmienia świat, ale czy rozwija się w sposób bezpieczny? AI Act (akt w sprawie sztucznej inteligencji) to pierwsze…

17.02.2025

Umowa wdrożenia oprogramowania bez pułapek – jak zabezpieczyć…

Wdrożenie oprogramowania to nie tylko kod, to także dobrze skonstruowana umowa, która chroni interesy obydwu stron. Zamawiający chce jasnych zasad i…

30.05.2025

Doradztwo podatkowe dla IT i firm technologicznych –…

Rok 2025 przynosi istotne zmiany w zakresie podatku VAT – od nowelizacji przepisów po obowiązkowe wdrożenie Krajowego Systemu e-Faktur (KSeF). W…

12.06.2025

Jak legalnie prowadzić dropshipping? Drop informacji prawnych o…

Dropshipping to bardzo popularny sposób na prowadzenie sprzedaży, kojarzony często ze sprzedażą produktów z Chin lub innych państw azjatyckich. Zazwyczaj mówi…

29.05.2025

Dostępność cyfrowa w e-commerce – Co musisz wiedzieć…

Pod koniec ubiegłego roku informowaliśmy o nadchodzących zmianach w e-commerce w 2025 roku. Jedną z kluczowych nowości, które wkrótce wejdą w…

09.05.2025

Ubezpieczenie ryzyk cybernetycznych – czym jest i kiedy…

Ataki ransomware, wycieki danych, cyfrowe szantaże – ile razy powiedziałeś sobie „mnie to nie dotyczy, to problem dużych korporacji”? Tymczasem cyberprzestępcy…

30.01.2025

Rejestracja znaku towarowego w UE z dofinansowaniem SME…

Rejestracja znaku towarowego w Unii Europejskiej to kluczowy krok w zabezpieczeniu marki i budowaniu jej rozpoznawalności na rynku. Dla mikro, małych…

10.01.2025

Najczęstsze błędy przy rejestracji znaku towarowego w EUIPO…

Rejestracja znaku towarowego w Urzędzie Unii Europejskiej ds. Własności Intelektualnej (EUIPO) to kluczowy krok dla każdego przedsiębiorcy, który chce chronić swoją…

03.02.2025

Reklamowanie oraz oznaczanie współpracy przez influencerów

„Reklama dźwignią handlu” – to hasło zna chyba każdy. W dobie marketingu internetowego i rosnącej roli influencerów skuteczna promocja w social…

15.04.2025

Dyrektywa Omnibus w praktyce – czyli jak sklepy…

Dyrektywa Omnibus miała być odpowiedzią na wyzwania współczesnego e-commerce: fałszywe promocje, brak przejrzystości w informowaniu o cenach, nieuczciwe techniki sprzedażowe. Jej…

Pokaż więcej

Warning: Trying to access array offset on false in /home/maciejka/domains/silesialegalhouse.pl/public_html/wp-content/themes/SLH/single.php on line 179
Tomasz Grot
  • Adwokat
  • Mediator

Jako adwokat wspieram przedsiębiorców z różnych sektorów – od branży budowlanej i produkcyjnej, przez sektor gastronomiczny, aż po dynamicznie rozwijające się firmy e-commerce i instytucje kultury. Dostarczam klientom rozwiązania prawne, dopasowane do realiów ich działalności operacyjnej i potrzeb rozwoju, które sprawdzają się w praktyce.

Obszary specjalizacji:

  • Prawo własności intelektualnej
  • Ochrona danych osobowych
  • Cyberbezpieczeństwo
  • Doradztwo prawne dla branży e-commerce
  • Prawo pracy

Masz pytanie?