Czym jest Data Leakage Prevention?

Definicja

Data Leakage Prevention (DLP) to zbiór technologii, procedur i mechanizmów kontrolnych mających na celu identyfikowanie, monitorowanie oraz blokowanie nieautoryzowanego ujawnienia danych poufnych. Obejmuje to dane osobowe, dane szczególnej kategorii (art. 9 RODO), informacje finansowe, dane medyczne, tajemnice przedsiębiorstwa oraz wszelkie materiały, których ujawnienie może naruszać przepisy prawa lub powodować szkody organizacyjne.

DLP funkcjonuje na zasadzie analizy przepływu danych - w spoczynku, w użyciu oraz w tranzycie - oraz stosuje reguły klasyfikacji i polityki kontroli, które ograniczają możliwość ujawnienia informacji poprzez systemy informatyczne, kanały komunikacji, urządzenia peryferyjne lub personel.

Zakres działania systemów DLP

  • DLP Endpoint - monitorowanie aktywności na urządzeniach końcowych (np. kopiowanie plików, zrzuty ekranu, USB).
  • DLP Network - analiza pakietów i treści przesyłanych przez sieć (np. e-mail, HTTP, FTP).
  • DLP Storage - skanowanie repozytoriów danych (NAS, chmura, lokalne zasoby) pod kątem treści wrażliwych.

Metody detekcji w DLP

  • Content inspection - analiza pełnej treści dokumentów, w tym obrazów i PDF.
  • Regex / pattern matching - wykrywanie danych takich jak PESEL, numery kart, adresy.
  • Machine learning-based classification - klasyfikacja treści na podstawie modeli uczonych.
  • OCR (Optical Character Recognition) - wykrywanie tekstu w materiałach graficznych i wideo.
  • Contextual analysis - uwzględnianie użytkownika, aplikacji, lokalizacji i zachowań.

Parametry i kluczowe metryki

Metryka

Znaczenie

True Positive Rate (TPR)

Skuteczność wykrywania rzeczywistych przypadków naruszeń.

False Positive Rate (FPR)

Odsetek błędnych alarmów powodujących niepotrzebną blokadę działań.

Latency

Opóźnienie w analizie danych, szczególnie ważne w transmisjach wideo.

Coverage

Zakres typów danych i lokalizacji objętych ochroną.

Zastosowanie DLP w anonimizacji zdjęć i wideo

DLP wspiera procesy anonimizacji wizualnej, ponieważ wiele wycieków danych następuje poprzez materiały graficzne i nagrania. Połączenie DLP z systemami AI umożliwia wykrywanie nieautoryzowanych przesyłów wideo zawierających dane osobowe, w szczególności:

  • twarze, tablice rejestracyjne, wizerunek osób,
  • dane wrażliwe zapisane w plikach graficznych (np. dokumenty skanowane),
  • elementy tła ujawniające informacje identyfikujące.

Typowe integracje obejmują:

  • blokowanie wysyłania niezanonimizowanych nagrań poza sieć organizacji,
  • automatyczne wykrywanie naruszeń polityk na plikach wideo,
  • kontrolę eksportu materiałów wizualnych w systemach medycznych i przemysłowych,
  • powiązanie z narzędziami do automatycznej anonimizacji (on-premise i edge).

Wyzwania i ograniczenia

  • Fałszywe alarmy wynikające z zastosowania wzorców o wysokiej czułości.
  • Wysoki koszt operacyjny przy dużej liczbie plików wideo i obrazów.
  • Złożoność wdrożenia w środowiskach hybrydowych (on-premise + chmura).
  • Ograniczenia OCR w niskiej jakości nagraniach.
  • Integracje RODO wymagające ścisłej kontroli logów i retencji.

Przykłady zastosowań

  • kontrola wysyłki plików wideo zawierających niezanonimizowane twarze,
  • monitorowanie kanałów komunikacji w instytucjach finansowych,
  • ochrona danych pacjentów na nagraniach medycznych,
  • zabezpieczenie materiałów dowodowych przed nieautoryzowanym przetwarzaniem,
  • wykrywanie wycieków danych w środowiskach produkcyjnych.