RODO a Narzędzia AI: Gdzie Trafiają Dane, Które Wklejasz do Tłumacza i Parafrazera?
Twój pracownik wkleja umowę kontrahenta do ChatGPT, żeby ją streścić. Prawnik podsumowuje NDA w darmowym tłumaczu AI. Księgowa wrzuca fakturę do parafrazera, żeby przeredagować opis usługi. Każda z tych czynności — z perspektywy RODO — jest przetwarzaniem danych osobowych, które właśnie opuściły kontrolę Twojej organizacji.
Pytanie, które zadaje zaskakująco mało firm: gdzie dokładnie trafiają te dane? Kto je przetwarza? Czy są wykorzystywane do trenowania modelu AI? Czy opuszczają Europejski Obszar Gospodarczy? Czy istnieje umowa powierzenia danych? Czy można je usunąć?
Odpowiedzi na te pytania decydują o tym, czy Twoja firma narusza RODO — a kary sięgają 20 mln EUR lub 4% globalnego rocznego obrotu. Włoski organ ochrony danych nałożył na OpenAI 15 mln EUR kary za brak transparentności i niedostateczną weryfikację wieku. To nie abstrakcyjne ryzyko — to precedens, który wyznacza kierunek egzekwowania prawa w całej UE.
Niniejszy artykuł stanowi analizę prawno-techniczną tego, co dzieje się z danymi wklejanymi do narzędzi AI — od momentu naciśnięcia „Wklej” do momentu, gdy próbujesz je usunąć. Łączymy perspektywę ochrony danych osobowych z praktycznym doświadczeniem budowy bazgraj.pl — narzędzia AI zaprojektowanego od podstaw z myślą o prywatności użytkowników.
Co dzieje się z Twoim tekstem: trzy ścieżki danych
Gdy wklejasz tekst do narzędzia AI, dane mogą trafić na jedną z trzech ścieżek — w zależności od dostawcy, planu cenowego i konfiguracji konta. Zrozumienie tych ścieżek jest fundamentem oceny ryzyka RODO.
Ścieżka 1: Dane trafiają do treningu modelu
Darmowe wersje ChatGPT domyślnie wykorzystują treść promptów do dalszego trenowania modelu. OpenAI nie ukrywa tego — funkcja „Improve the model for everyone” jest włączona domyślnie. Oznacza to, że tekst wklejony przez Twojego pracownika — umowa, dane klienta, poufna korespondencja — może zostać przetworzy i włączony do zbioru treningowego.
Konsekwencja prawna: dane osobowe wklejone do promptu mogą zostać „wyuczone” przez model i potencjalnie odtworzone w odpowiedziach dla innych użytkowników. Prawo do usunięcia danych (art. 17 RODO — „prawo do bycia zapomnianym”) w odniesieniu do zbioru treningowego AI jest praktycznie nieegzekwowalne. Nie istnieje techniczny mechanizm „wyjęcia” konkretnych danych z wytrenowanego modelu.
Niektóre narzędzia oferują opcję opt-out — wyłączenia wykorzystania danych do treningu. Ale wymaga to świadomego działania użytkownika, a w firmowym kontekście Shadow AI oznacza, że pracownicy najczęściej korzystają z darmowych kont osobistych, gdzie takie opcje nie są skonfigurowane.
Ścieżka 2: Dane są przetwarzane i przechowywane
Nawet gdy narzędzie AI nie wykorzystuje danych do treningu, tekst jest przetwarzany na serwerach dostawcy. W przypadku OpenAI — na serwerach Microsoft Azure, zlokalizowanych w USA i Europie. Dane mogą być przechowywane w logach konwersacji, w systemach monitoringu jakości, w bazach do analizy nadużyć.
Każda z tych operacji stanowi „przetwarzanie” w rozumieniu RODO. Dostawca narzędzia AI jest w tej relacji podprocesorem — a między Twoją firmą (administratorem danych) a dostawcą musi istnieć umowa powierzenia przetwarzania danych (DPA — Data Processing Agreement). Dla darmowych wersji ChatGPT, Claude czy Gemini — taka umowa nie istnieje w relacji biznesowej. DPA jest dostępne wyłącznie dla planów Enterprise i API.
Ścieżka 3: Dane opuszczają EOG
Transfer danych osobowych poza Europejski Obszar Gospodarczy podlega dodatkowym wymogom RODO (rozdział V). OpenAI to firma amerykańska. Anthropic (Claude) — również. Google (Gemini) — również. Przetwarzanie tekstu przez ich infrastrukturę może oznaczać transfer danych do USA — jurysdykcji, w której poziom ochrony danych osobowych nie jest uznawany za adekwatny przez Komisję Europejską bez dodatkowych zabezpieczeń.
Nowy EU-US Data Privacy Framework zapewnia pewien poziom ochrony, ale dotyczy wyłącznie firm certyfikowanych w ramach tego mechanizmu. Dla narzędzi AI bez jasnej deklaracji lokalizacji przetwarzania — ryzyko transferu jest realne.
RODO artykuł po artykule: gdzie łamiesz prawo
Korzystanie z narzędzi AI bez odpowiednich zabezpieczeń narusza konkretne artykuły RODO. Poniższa analiza mapuje najczęstsze scenariusze na przepisy — i pokazuje, dlaczego „nie wiedziałem” nie jest linią obrony.
| Artykuł RODO | Wymóg | Jak narzędzia AI go naruszają |
|---|---|---|
| Art. 5 — Zgodność z prawem, przejrzystość | Przetwarzanie musi być transparentne | Firma nie wie, że pracownik wkleja dane do AI = brak transparentności |
| Art. 6 — Podstawa prawna | Przetwarzanie wymaga podstawy prawnej | Brak umowy z dostawcą AI = brak podstawy do przetwarzania przez podmiot trzeci |
| Art. 13/14 — Obowiązek informacyjny | Informowanie osób o przetwarzaniu ich danych | Klient nie wie, że jego umowa trafiła do ChatGPT |
| Art. 17 — Prawo do usunięcia | „Prawo do bycia zapomnianym” | Usunięcie danych z datasetu treningowego AI jest praktycznie niemożliwe |
| Art. 28 — Powierzenie przetwarzania | Umowa DPA z każdym podprocesorem | Darmowy ChatGPT nie oferuje DPA dla użytkowników indywidualnych |
| Art. 35 — DPIA | Ocena skutków przetwarzania | Wymagana przy wysokim ryzyku — niemożliwa, gdy firma nie wie o Shadow AI |
| Art. 44–49 — Transfer poza EOG | Dodatkowe zabezpieczenia | Dane przetwarzane na serwerach w USA bez mechanizmu transferu |
Kluczowe: odpowiedzialność za zgodność z RODO spoczywa na administratorze danych — czyli na Twojej firmie, nie na pracowniku i nie na dostawcy narzędzia AI. Gdy UODO puka do drzwi, to firma odpowiada za brak DPA, brak DPIA i brak informacji dla osób, których dane trafiły do modelu.
Więcej o procedurze zgłaszania naruszeń do UODO i praktycznym case study zgłoszenia.
7 pytań, które musisz zadać dostawcy narzędzia AI
Zanim włączysz narzędzie AI do procesów firmowych, zadaj dostawcy siedem pytań. Odpowiedzi (lub ich brak) powiedzą Ci wszystko o ryzyku RODO.
1. Czy moje dane są wykorzystywane do trenowania modelu? Jeśli tak — nie wklejaj niczego poufnego. Jeśli można to wyłączyć — upewnij się, że jest wyłączone na poziomie organizacji, nie indywidualnego konta.
2. Gdzie są przetwarzane moje dane (geolokalizacja serwerów)? Przetwarzanie w EOG jest bezpieczniejsze z perspektywy RODO. Przetwarzanie w USA wymaga dodatkowych mechanizmów transferu.
3. Czy oferujesz umowę powierzenia przetwarzania danych (DPA)? Brak DPA = brak podstawy prawnej do powierzenia danych podmiotowi trzeciemu. To nie jest opcja — to wymóg art. 28 RODO.
4. Jak długo przechowujesz moje dane i logi? Im krócej, tym lepiej. Ideał: dane przetwarzane wyłącznie w pamięci operacyjnej, kasowane po zakończeniu sesji, bez logowania treści promptów.
5. Czy mogę usunąć swoje dane na żądanie? Art. 17 RODO wymaga możliwości usunięcia danych. Jeśli dostawca nie potrafi usunąć Twoich danych z logów i zbiorów treningowych — to poważna luka compliance.
6. Kto ma dostęp do moich danych wewnątrz organizacji dostawcy? Kontrola dostępu dotyczy również podprocesora. Pytanie o politykę dostępu pracowników dostawcy do treści promptów użytkowników.
7. Czy posiadasz certyfikacje bezpieczeństwa (SOC 2, ISO 27001)? Certyfikacje nie gwarantują zgodności z RODO, ale świadczą o dojrzałości procesów bezpieczeństwa. Brak jakichkolwiek certyfikacji u dostawcy AI to czerwona flaga.
Jak budowaliśmy bazgraj.pl: prywatność od pierwszego dnia
Doświadczenie z clev.one w zakresie ochrony danych i bezpieczeństwa aplikacji AI bezpośrednio wpłynęło na architekturę bazgraj.pl. Budując narzędzie do parafrazowania po polsku, musieliśmy odpowiedzieć na te same 7 pytań — ale od strony dostawcy.
Dane nie trenują modelu. Teksty wklejane do bazgraj.pl nie są wykorzystywane do trenowania ani doskonalenia żadnego modelu AI. Punkt.
Minimalne przechowywanie. Tekst jest przetwarzany w celu wygenerowania parafrazy i nie jest przechowywany po zakończeniu sesji. Brak logowania treści promptów.
Narzędzia klienckie bez transferu danych. Darmowe narzędzia na bazgraj.pl — licznik znaków, analiza czytelności, gęstość SEO, podgląd SERP, porównanie tekstów, generator slug URL, znajdź i zamień — przetwarzają tekst wyłącznie po stronie klienta (w przeglądarce użytkownika). Dane nigdy nie opuszczają urządzenia.
Zabezpieczenia przed prompt injection. Każde pole tekstowe jest zabezpieczone przed atakami prompt injection — sanityzacja inputu, limity pól, walidacja outputu, logowanie podejrzanych wzorców.
To nie jest wyłącznie kwestia etyki — to wymóg prawny. Art. 25 RODO nakłada obowiązek „ochrony danych w fazie projektowania i domyślnej ochrony danych” (privacy by design, privacy by default). Każde narzędzie AI, które przyjmuje tekst od użytkownika, powinno być projektowane z tymi zasadami od dnia zero.
Checklista RODO dla narzędzi AI w organizacji
Na podstawie analizy przepisów i doświadczeń z budowy narzędzi AI, poniżej przedstawiamy gotową checklistę do wdrożenia w polskich MŚP.
| Krok | Działanie | Priorytet |
|---|---|---|
| 1 | Zinwentaryzuj wszystkie narzędzia AI używane w firmie (w tym Shadow AI) | Krytyczny |
| 2 | Dla każdego narzędzia: sprawdź, czy istnieje DPA (umowa powierzenia danych) | Krytyczny |
| 3 | Zweryfikuj, czy dane nie są wykorzystywane do trenowania modelu | Krytyczny |
| 4 | Ustal geolokalizację przetwarzania — EOG vs. poza EOG | Wysoki |
| 5 | Przeprowadź DPIA (ocenę skutków) dla narzędzi przetwarzających dane osobowe | Wysoki |
| 6 | Zaktualizuj politykę prywatności firmy o informację o wykorzystaniu narzędzi AI | Wysoki |
| 7 | Zaktualizuj rejestr czynności przetwarzania (art. 30 RODO) | Wysoki |
| 8 | Przeszkol pracowników: co można, a czego nie można wklejać do AI | Wysoki |
| 9 | Wdróż zatwierdzoną listę narzędzi AI z podpisanymi DPA | Średni |
| 10 | Ustaw regularne przeglądy compliance — narzędzia AI zmieniają polityki co kwartał | Ciągły |
Wymogi NIS2: bezpieczeństwo narzędzi AI jako element zarządzania ryzykiem
Problematyka RODO a narzędzia AI wpisuje się w szerszy kontekst dyrektywy NIS2 i nowelizacji ustawy o krajowym systemie cyberbezpieczeństwa. Art. 21 NIS2 wymaga wdrożenia środków zarządzania ryzykiem obejmujących bezpieczeństwo łańcucha dostaw — a dostawcy narzędzi AI są elementem tego łańcucha.
Firma, która nie zna odpowiedzi na 7 pytań z powyższej sekcji, nie spełnia wymogu zarządzania ryzykiem dostawców. A kary NIS2 — do 10 mln EUR lub 2% globalnego obrotu dla podmiotów kluczowych — są niezależne od kar RODO. Organizacja może zostać ukarana podwójnie: za naruszenie RODO i za brak zarządzania ryzykiem w rozumieniu NIS2.
Sprawdź swoją kwalifikację w checkliście NIS2. Oszacuj koszty incydentu w kalkulatorze kosztów naruszenia danych.
Podsumowanie: wnioski operacyjne
Każde wklejenie tekstu do narzędzia AI to decyzja o przetwarzaniu danych — z konkretnymi konsekwencjami prawnymi. Problem nie polega na tym, że narzędzia AI są złe. Problem polega na tym, że większość firm nie zadaje pytań, zanim zacznie z nich korzystać.
Darmowe ≠ bezpłatne. Darmowe wersje narzędzi AI „płacą” za siebie danymi użytkowników. Tekst, który wklejasz, może trenować model, być przechowywany na serwerach poza EOG i być dostępny dla podprocesorów, o których istnieniu nie wiesz. Koszt „darmowego” narzędzia to potencjalnie 20 mln EUR kary RODO.
DPA to minimum, nie opcja. Bez umowy powierzenia przetwarzania danych — przetwarzanie jest nielegalne z mocy prawa. Jeśli dostawca nie oferuje DPA — nie jest partnerem do współpracy z danymi osobowymi.
Privacy by design to standard. Narzędzia AI powinny być projektowane z myślą o prywatności od pierwszego dnia — jak bazgraj.pl, gdzie darmowe narzędzia przetwarzają tekst po stronie klienta, a dane nie trenują modelu. Pytaj dostawców o architekturę prywatności — nie o marketing.
Twój plan na dziś:
- Zinwentaryzuj narzędzia AI używane w firmie — w tym te, o których nie wiesz (Shadow AI)
- Zadaj dostawcom 7 pytań z tego artykułu — jeśli nie potrafią odpowiedzieć, to czerwona flaga
- Sprawdź, czy masz DPA z każdym dostawcą AI przetwarzającym dane osobowe
- Wyłącz wykorzystanie danych do treningu w narzędziach, które na to pozwalają
- Zaktualizuj politykę prywatności i rejestr czynności przetwarzania
- Przeszkol zespół — pokaż scenariusze z tego artykułu
- Wdróż bezpieczne alternatywy: bazgraj.pl do pracy z tekstem, narzędzia klienckie bez transferu danych
- Sprawdź checklistę NIS2 — dostawcy AI to element łańcucha dostaw
- Rozważ canary tokens w katalogach z poufnymi danymi — wykryjesz moment, gdy ktoś sięga po dane do wklejenia
Potrzebujesz audytu zgodności RODO w kontekście narzędzi AI wdrożonych w Twojej organizacji? Zapytaj o testy penetracyjne clev.one — weryfikacja polityk przetwarzania danych, analiza wektorów wycieku i testy socjotechniczne. Szukasz narzędzia AI, które nie eksportuje Twoich danych? Wypróbuj bazgraj.pl — parafrazowanie, detekcja AI i darmowe narzędzia klienckie zaprojektowane z myślą o prywatności.
Chcesz chronić swoje dane?
Zapisz się na listę oczekujących i otrzymaj 2 miesiące gratis.
Zapisz się teraz