RODO a Narzędzia AI: Gdzie Trafiają Dane, Które Wklejasz do Tłumacza i Parafrazera?

Zespół clev.one
9 min czytania
RODO a Narzędzia AI: Gdzie Trafiają Dane, Które Wklejasz do Tłumacza i Parafrazera?

Twój pracownik wkleja umowę kontrahenta do ChatGPT, żeby ją streścić. Prawnik podsumowuje NDA w darmowym tłumaczu AI. Księgowa wrzuca fakturę do parafrazera, żeby przeredagować opis usługi. Każda z tych czynności — z perspektywy RODO — jest przetwarzaniem danych osobowych, które właśnie opuściły kontrolę Twojej organizacji.

Pytanie, które zadaje zaskakująco mało firm: gdzie dokładnie trafiają te dane? Kto je przetwarza? Czy są wykorzystywane do trenowania modelu AI? Czy opuszczają Europejski Obszar Gospodarczy? Czy istnieje umowa powierzenia danych? Czy można je usunąć?

Odpowiedzi na te pytania decydują o tym, czy Twoja firma narusza RODO — a kary sięgają 20 mln EUR lub 4% globalnego rocznego obrotu. Włoski organ ochrony danych nałożył na OpenAI 15 mln EUR kary za brak transparentności i niedostateczną weryfikację wieku. To nie abstrakcyjne ryzyko — to precedens, który wyznacza kierunek egzekwowania prawa w całej UE.

Niniejszy artykuł stanowi analizę prawno-techniczną tego, co dzieje się z danymi wklejanymi do narzędzi AI — od momentu naciśnięcia „Wklej” do momentu, gdy próbujesz je usunąć. Łączymy perspektywę ochrony danych osobowych z praktycznym doświadczeniem budowy bazgraj.pl — narzędzia AI zaprojektowanego od podstaw z myślą o prywatności użytkowników.

Co dzieje się z Twoim tekstem: trzy ścieżki danych

Gdy wklejasz tekst do narzędzia AI, dane mogą trafić na jedną z trzech ścieżek — w zależności od dostawcy, planu cenowego i konfiguracji konta. Zrozumienie tych ścieżek jest fundamentem oceny ryzyka RODO.

Ścieżka 1: Dane trafiają do treningu modelu

Darmowe wersje ChatGPT domyślnie wykorzystują treść promptów do dalszego trenowania modelu. OpenAI nie ukrywa tego — funkcja „Improve the model for everyone” jest włączona domyślnie. Oznacza to, że tekst wklejony przez Twojego pracownika — umowa, dane klienta, poufna korespondencja — może zostać przetworzy i włączony do zbioru treningowego.

Konsekwencja prawna: dane osobowe wklejone do promptu mogą zostać „wyuczone” przez model i potencjalnie odtworzone w odpowiedziach dla innych użytkowników. Prawo do usunięcia danych (art. 17 RODO — „prawo do bycia zapomnianym”) w odniesieniu do zbioru treningowego AI jest praktycznie nieegzekwowalne. Nie istnieje techniczny mechanizm „wyjęcia” konkretnych danych z wytrenowanego modelu.

Niektóre narzędzia oferują opcję opt-out — wyłączenia wykorzystania danych do treningu. Ale wymaga to świadomego działania użytkownika, a w firmowym kontekście Shadow AI oznacza, że pracownicy najczęściej korzystają z darmowych kont osobistych, gdzie takie opcje nie są skonfigurowane.

Ścieżka 2: Dane są przetwarzane i przechowywane

Nawet gdy narzędzie AI nie wykorzystuje danych do treningu, tekst jest przetwarzany na serwerach dostawcy. W przypadku OpenAI — na serwerach Microsoft Azure, zlokalizowanych w USA i Europie. Dane mogą być przechowywane w logach konwersacji, w systemach monitoringu jakości, w bazach do analizy nadużyć.

Każda z tych operacji stanowi „przetwarzanie” w rozumieniu RODO. Dostawca narzędzia AI jest w tej relacji podprocesorem — a między Twoją firmą (administratorem danych) a dostawcą musi istnieć umowa powierzenia przetwarzania danych (DPA — Data Processing Agreement). Dla darmowych wersji ChatGPT, Claude czy Gemini — taka umowa nie istnieje w relacji biznesowej. DPA jest dostępne wyłącznie dla planów Enterprise i API.

Ścieżka 3: Dane opuszczają EOG

Transfer danych osobowych poza Europejski Obszar Gospodarczy podlega dodatkowym wymogom RODO (rozdział V). OpenAI to firma amerykańska. Anthropic (Claude) — również. Google (Gemini) — również. Przetwarzanie tekstu przez ich infrastrukturę może oznaczać transfer danych do USA — jurysdykcji, w której poziom ochrony danych osobowych nie jest uznawany za adekwatny przez Komisję Europejską bez dodatkowych zabezpieczeń.

Nowy EU-US Data Privacy Framework zapewnia pewien poziom ochrony, ale dotyczy wyłącznie firm certyfikowanych w ramach tego mechanizmu. Dla narzędzi AI bez jasnej deklaracji lokalizacji przetwarzania — ryzyko transferu jest realne.

RODO artykuł po artykule: gdzie łamiesz prawo

Korzystanie z narzędzi AI bez odpowiednich zabezpieczeń narusza konkretne artykuły RODO. Poniższa analiza mapuje najczęstsze scenariusze na przepisy — i pokazuje, dlaczego „nie wiedziałem” nie jest linią obrony.

Artykuł RODO Wymóg Jak narzędzia AI go naruszają
Art. 5 — Zgodność z prawem, przejrzystość Przetwarzanie musi być transparentne Firma nie wie, że pracownik wkleja dane do AI = brak transparentności
Art. 6 — Podstawa prawna Przetwarzanie wymaga podstawy prawnej Brak umowy z dostawcą AI = brak podstawy do przetwarzania przez podmiot trzeci
Art. 13/14 — Obowiązek informacyjny Informowanie osób o przetwarzaniu ich danych Klient nie wie, że jego umowa trafiła do ChatGPT
Art. 17 — Prawo do usunięcia „Prawo do bycia zapomnianym” Usunięcie danych z datasetu treningowego AI jest praktycznie niemożliwe
Art. 28 — Powierzenie przetwarzania Umowa DPA z każdym podprocesorem Darmowy ChatGPT nie oferuje DPA dla użytkowników indywidualnych
Art. 35 — DPIA Ocena skutków przetwarzania Wymagana przy wysokim ryzyku — niemożliwa, gdy firma nie wie o Shadow AI
Art. 44–49 — Transfer poza EOG Dodatkowe zabezpieczenia Dane przetwarzane na serwerach w USA bez mechanizmu transferu

Kluczowe: odpowiedzialność za zgodność z RODO spoczywa na administratorze danych — czyli na Twojej firmie, nie na pracowniku i nie na dostawcy narzędzia AI. Gdy UODO puka do drzwi, to firma odpowiada za brak DPA, brak DPIA i brak informacji dla osób, których dane trafiły do modelu.

Więcej o procedurze zgłaszania naruszeń do UODO i praktycznym case study zgłoszenia.

7 pytań, które musisz zadać dostawcy narzędzia AI

Zanim włączysz narzędzie AI do procesów firmowych, zadaj dostawcy siedem pytań. Odpowiedzi (lub ich brak) powiedzą Ci wszystko o ryzyku RODO.

1. Czy moje dane są wykorzystywane do trenowania modelu? Jeśli tak — nie wklejaj niczego poufnego. Jeśli można to wyłączyć — upewnij się, że jest wyłączone na poziomie organizacji, nie indywidualnego konta.

2. Gdzie są przetwarzane moje dane (geolokalizacja serwerów)? Przetwarzanie w EOG jest bezpieczniejsze z perspektywy RODO. Przetwarzanie w USA wymaga dodatkowych mechanizmów transferu.

3. Czy oferujesz umowę powierzenia przetwarzania danych (DPA)? Brak DPA = brak podstawy prawnej do powierzenia danych podmiotowi trzeciemu. To nie jest opcja — to wymóg art. 28 RODO.

4. Jak długo przechowujesz moje dane i logi? Im krócej, tym lepiej. Ideał: dane przetwarzane wyłącznie w pamięci operacyjnej, kasowane po zakończeniu sesji, bez logowania treści promptów.

5. Czy mogę usunąć swoje dane na żądanie? Art. 17 RODO wymaga możliwości usunięcia danych. Jeśli dostawca nie potrafi usunąć Twoich danych z logów i zbiorów treningowych — to poważna luka compliance.

6. Kto ma dostęp do moich danych wewnątrz organizacji dostawcy? Kontrola dostępu dotyczy również podprocesora. Pytanie o politykę dostępu pracowników dostawcy do treści promptów użytkowników.

7. Czy posiadasz certyfikacje bezpieczeństwa (SOC 2, ISO 27001)? Certyfikacje nie gwarantują zgodności z RODO, ale świadczą o dojrzałości procesów bezpieczeństwa. Brak jakichkolwiek certyfikacji u dostawcy AI to czerwona flaga.

Jak budowaliśmy bazgraj.pl: prywatność od pierwszego dnia

Doświadczenie z clev.one w zakresie ochrony danych i bezpieczeństwa aplikacji AI bezpośrednio wpłynęło na architekturę bazgraj.pl. Budując narzędzie do parafrazowania po polsku, musieliśmy odpowiedzieć na te same 7 pytań — ale od strony dostawcy.

Dane nie trenują modelu. Teksty wklejane do bazgraj.pl nie są wykorzystywane do trenowania ani doskonalenia żadnego modelu AI. Punkt.

Minimalne przechowywanie. Tekst jest przetwarzany w celu wygenerowania parafrazy i nie jest przechowywany po zakończeniu sesji. Brak logowania treści promptów.

Narzędzia klienckie bez transferu danych. Darmowe narzędzia na bazgraj.pl — licznik znaków, analiza czytelności, gęstość SEO, podgląd SERP, porównanie tekstów, generator slug URL, znajdź i zamień — przetwarzają tekst wyłącznie po stronie klienta (w przeglądarce użytkownika). Dane nigdy nie opuszczają urządzenia.

Zabezpieczenia przed prompt injection. Każde pole tekstowe jest zabezpieczone przed atakami prompt injection — sanityzacja inputu, limity pól, walidacja outputu, logowanie podejrzanych wzorców.

To nie jest wyłącznie kwestia etyki — to wymóg prawny. Art. 25 RODO nakłada obowiązek „ochrony danych w fazie projektowania i domyślnej ochrony danych” (privacy by design, privacy by default). Każde narzędzie AI, które przyjmuje tekst od użytkownika, powinno być projektowane z tymi zasadami od dnia zero.

Checklista RODO dla narzędzi AI w organizacji

Na podstawie analizy przepisów i doświadczeń z budowy narzędzi AI, poniżej przedstawiamy gotową checklistę do wdrożenia w polskich MŚP.

Krok Działanie Priorytet
1 Zinwentaryzuj wszystkie narzędzia AI używane w firmie (w tym Shadow AI) Krytyczny
2 Dla każdego narzędzia: sprawdź, czy istnieje DPA (umowa powierzenia danych) Krytyczny
3 Zweryfikuj, czy dane nie są wykorzystywane do trenowania modelu Krytyczny
4 Ustal geolokalizację przetwarzania — EOG vs. poza EOG Wysoki
5 Przeprowadź DPIA (ocenę skutków) dla narzędzi przetwarzających dane osobowe Wysoki
6 Zaktualizuj politykę prywatności firmy o informację o wykorzystaniu narzędzi AI Wysoki
7 Zaktualizuj rejestr czynności przetwarzania (art. 30 RODO) Wysoki
8 Przeszkol pracowników: co można, a czego nie można wklejać do AI Wysoki
9 Wdróż zatwierdzoną listę narzędzi AI z podpisanymi DPA Średni
10 Ustaw regularne przeglądy compliance — narzędzia AI zmieniają polityki co kwartał Ciągły

Wymogi NIS2: bezpieczeństwo narzędzi AI jako element zarządzania ryzykiem

Problematyka RODO a narzędzia AI wpisuje się w szerszy kontekst dyrektywy NIS2 i nowelizacji ustawy o krajowym systemie cyberbezpieczeństwa. Art. 21 NIS2 wymaga wdrożenia środków zarządzania ryzykiem obejmujących bezpieczeństwo łańcucha dostaw — a dostawcy narzędzi AI są elementem tego łańcucha.

Firma, która nie zna odpowiedzi na 7 pytań z powyższej sekcji, nie spełnia wymogu zarządzania ryzykiem dostawców. A kary NIS2 — do 10 mln EUR lub 2% globalnego obrotu dla podmiotów kluczowych — są niezależne od kar RODO. Organizacja może zostać ukarana podwójnie: za naruszenie RODO i za brak zarządzania ryzykiem w rozumieniu NIS2.

Sprawdź swoją kwalifikację w checkliście NIS2. Oszacuj koszty incydentu w kalkulatorze kosztów naruszenia danych.

Podsumowanie: wnioski operacyjne

Każde wklejenie tekstu do narzędzia AI to decyzja o przetwarzaniu danych — z konkretnymi konsekwencjami prawnymi. Problem nie polega na tym, że narzędzia AI są złe. Problem polega na tym, że większość firm nie zadaje pytań, zanim zacznie z nich korzystać.

Darmowe ≠ bezpłatne. Darmowe wersje narzędzi AI „płacą” za siebie danymi użytkowników. Tekst, który wklejasz, może trenować model, być przechowywany na serwerach poza EOG i być dostępny dla podprocesorów, o których istnieniu nie wiesz. Koszt „darmowego” narzędzia to potencjalnie 20 mln EUR kary RODO.

DPA to minimum, nie opcja. Bez umowy powierzenia przetwarzania danych — przetwarzanie jest nielegalne z mocy prawa. Jeśli dostawca nie oferuje DPA — nie jest partnerem do współpracy z danymi osobowymi.

Privacy by design to standard. Narzędzia AI powinny być projektowane z myślą o prywatności od pierwszego dnia — jak bazgraj.pl, gdzie darmowe narzędzia przetwarzają tekst po stronie klienta, a dane nie trenują modelu. Pytaj dostawców o architekturę prywatności — nie o marketing.

Twój plan na dziś:

  1. Zinwentaryzuj narzędzia AI używane w firmie — w tym te, o których nie wiesz (Shadow AI)
  2. Zadaj dostawcom 7 pytań z tego artykułu — jeśli nie potrafią odpowiedzieć, to czerwona flaga
  3. Sprawdź, czy masz DPA z każdym dostawcą AI przetwarzającym dane osobowe
  4. Wyłącz wykorzystanie danych do treningu w narzędziach, które na to pozwalają
  5. Zaktualizuj politykę prywatności i rejestr czynności przetwarzania
  6. Przeszkol zespół — pokaż scenariusze z tego artykułu
  7. Wdróż bezpieczne alternatywy: bazgraj.pl do pracy z tekstem, narzędzia klienckie bez transferu danych
  8. Sprawdź checklistę NIS2 — dostawcy AI to element łańcucha dostaw
  9. Rozważ canary tokens w katalogach z poufnymi danymi — wykryjesz moment, gdy ktoś sięga po dane do wklejenia

Potrzebujesz audytu zgodności RODO w kontekście narzędzi AI wdrożonych w Twojej organizacji? Zapytaj o testy penetracyjne clev.one — weryfikacja polityk przetwarzania danych, analiza wektorów wycieku i testy socjotechniczne. Szukasz narzędzia AI, które nie eksportuje Twoich danych? Wypróbuj bazgraj.plparafrazowanie, detekcja AI i darmowe narzędzia klienckie zaprojektowane z myślą o prywatności.

Tagi: #RODO #AI #ChatGPT #ochrona-danych #NIS2 #UODO #msp

Chcesz chronić swoje dane?

Zapisz się na listę oczekujących i otrzymaj 2 miesiące gratis.

Zapisz się teraz