Definicja
Data Leakage Prevention (DLP) to zbiór technologii, procedur i mechanizmów kontrolnych mających na celu identyfikowanie, monitorowanie oraz blokowanie nieautoryzowanego ujawnienia danych poufnych. Obejmuje to dane osobowe, dane szczególnej kategorii (art. 9 RODO), informacje finansowe, dane medyczne, tajemnice przedsiębiorstwa oraz wszelkie materiały, których ujawnienie może naruszać przepisy prawa lub powodować szkody organizacyjne.
DLP funkcjonuje na zasadzie analizy przepływu danych - w spoczynku, w użyciu oraz w tranzycie - oraz stosuje reguły klasyfikacji i polityki kontroli, które ograniczają możliwość ujawnienia informacji poprzez systemy informatyczne, kanały komunikacji, urządzenia peryferyjne lub personel.
Zakres działania systemów DLP
- DLP Endpoint - monitorowanie aktywności na urządzeniach końcowych (np. kopiowanie plików, zrzuty ekranu, USB).
- DLP Network - analiza pakietów i treści przesyłanych przez sieć (np. e-mail, HTTP, FTP).
- DLP Storage - skanowanie repozytoriów danych (NAS, chmura, lokalne zasoby) pod kątem treści wrażliwych.
Metody detekcji w DLP
- Content inspection - analiza pełnej treści dokumentów, w tym obrazów i PDF.
- Regex / pattern matching - wykrywanie danych takich jak PESEL, numery kart, adresy.
- Machine learning-based classification - klasyfikacja treści na podstawie modeli uczonych.
- OCR (Optical Character Recognition) - wykrywanie tekstu w materiałach graficznych i wideo.
- Contextual analysis - uwzględnianie użytkownika, aplikacji, lokalizacji i zachowań.
Parametry i kluczowe metryki
Metryka | Znaczenie |
True Positive Rate (TPR) | Skuteczność wykrywania rzeczywistych przypadków naruszeń. |
False Positive Rate (FPR) | Odsetek błędnych alarmów powodujących niepotrzebną blokadę działań. |
Latency | Opóźnienie w analizie danych, szczególnie ważne w transmisjach wideo. |
Coverage | Zakres typów danych i lokalizacji objętych ochroną. |
Zastosowanie DLP w anonimizacji zdjęć i wideo
DLP wspiera procesy anonimizacji wizualnej, ponieważ wiele wycieków danych następuje poprzez materiały graficzne i nagrania. Połączenie DLP z systemami AI umożliwia wykrywanie nieautoryzowanych przesyłów wideo zawierających dane osobowe, w szczególności:
- twarze, tablice rejestracyjne, wizerunek osób,
- dane wrażliwe zapisane w plikach graficznych (np. dokumenty skanowane),
- elementy tła ujawniające informacje identyfikujące.
Typowe integracje obejmują:
- blokowanie wysyłania niezanonimizowanych nagrań poza sieć organizacji,
- automatyczne wykrywanie naruszeń polityk na plikach wideo,
- kontrolę eksportu materiałów wizualnych w systemach medycznych i przemysłowych,
- powiązanie z narzędziami do automatycznej anonimizacji (on-premise i edge).
Wyzwania i ograniczenia
- Fałszywe alarmy wynikające z zastosowania wzorców o wysokiej czułości.
- Wysoki koszt operacyjny przy dużej liczbie plików wideo i obrazów.
- Złożoność wdrożenia w środowiskach hybrydowych (on-premise + chmura).
- Ograniczenia OCR w niskiej jakości nagraniach.
- Integracje RODO wymagające ścisłej kontroli logów i retencji.
Przykłady zastosowań
- kontrola wysyłki plików wideo zawierających niezanonimizowane twarze,
- monitorowanie kanałów komunikacji w instytucjach finansowych,
- ochrona danych pacjentów na nagraniach medycznych,
- zabezpieczenie materiałów dowodowych przed nieautoryzowanym przetwarzaniem,
- wykrywanie wycieków danych w środowiskach produkcyjnych.