1. U cuncettu di Data Masking
A maschera di dati hè ancu cunnisciuta cum'è maschera di dati. Hè un metudu tecnicu per cunvertisce, mudificà o copre e dati sensittivi cum'è u numeru di telefuninu, u numeru di carta bancaria è altre informazioni quandu avemu datu regule è pulitiche di maschera. Sta tecnica hè principalmente usata per impedisce chì e dati sensibili sò usati direttamente in ambienti inaffidabili.
Principiu di mascheramentu di dati: a maschera di dati deve mantene e caratteristiche originali di dati, e regule cummerciale è a pertinenza di e dati per assicurà chì u sviluppu, a prova è l'analisi di dati sussegwente ùn saranu micca affettati da a maschera. Assicurà a cunsistenza è a validità di e dati prima è dopu a maschera.
2. Data Masking classificazione
A maschera di dati pò esse divisa in maschera di dati statica (SDM) è maschera di dati dinamica (DDM).
Mascheratura di dati statici (SDM): A maschera di dati statici richiede l'istituzione di una nova basa di dati di l'ambiente non-produzzione per l'isolamentu da l'ambiente di produzzione. I dati sensittivi sò estratti da a basa di dati di produzzione è poi guardati in a basa di dati non-produzzione. In questu modu, i dati desensibilizzati sò isolati da l'ambiente di produzzione, chì risponde à i bisogni di l'affari è assicura a sicurità di e dati di produzzione.
Maschera dinamica di dati (DDM): Hè generalmente utilizatu in l'ambiente di produzzione per desensibilizà e dati sensibili in tempu reale. Calchì volta, differente livelli di maschera sò nicissarii à leghje i stessi dati sensittivi in situazioni differente. Per esempiu, diversi roli è permessi ponu implementà diversi schemi di mascheratura.
Rapportu di dati è applicazione di maschera di i prudutti di dati
Tali scenarii includenu principalmente prudutti di monitoraghju di dati internu o cartellone, prudutti di dati di servizii esterni, è rapporti basati nantu à l'analisi di dati, cum'è rapporti di cummerciale è rivista di prughjettu.
3. Data Masking Solution
I schemi di mascheramentu di dati cumuni includenu: invalidazione, valore aleatoriu, rimpiazzamentu di dati, criptografia simmetrica, valore mediu, offset è arrotondamentu, etc.
Invalidazione: L'invalidazione si riferisce à a criptografia, u troncamentu o l'ocultazione di dati sensibili. Stu schema di solitu rimpiazza dati reali cù simboli spiciali (cum'è *). U funziunamentu hè simplice, ma l'utilizatori ùn ponu micca sapè u formatu di i dati originali, chì ponu influenzà l'applicazioni di dati successive.
Valore aleatoriu: U valore aleatoriu si riferisce à a sustituzione aleatoria di dati sensibili (i numeri rimpiazzanu i numeri, e lettere rimpiazzanu e lettere, è i caratteri rimpiazzanu i caratteri). Stu mètudu masking vi assicurà u furmatu di dati sensittivi à un certu puntu è facilità appiicazioni dati sussegwente. Dizionari di maschera pò esse necessariu per qualchi parolle significati, cum'è nomi di persone è di lochi.
Sustituzione di dati: A sustituzione di dati hè simile à a maschera di valori nulli è aleatorii, salvu chì invece di utilizà caratteri speciali o valori aleatorii, i dati di maschera sò rimpiazzati cù un valore specificu.
Encryption simmetrica: A criptografia simmetrica hè un metudu speciale di mascheramentu reversibile. Cripta e dati sensibili per mezu di chjavi di criptografia è algoritmi. U furmatu di ciphertext hè coherente cù i dati originali in reguli lògichi.
Media: U schema mediu hè spessu usatu in scenarii statistichi. Per i dati numerichi, prima calculemu a so media, è poi distribuimu aleatoriamente i valori desensitizzati intornu à a media, mantenendu cusì a summa di e dati constante.
Offset è arrotondamentu: Stu metudu cambia i dati digitali per turnu aleatoriu. L'arrotondamentu offset assicura l'autenticità apprussimativa di a gamma mentre mantene a sicurità di e dati, chì hè più vicinu à i dati veri cà i schemi precedenti, è hà un grande significatu in u scenariu di l'analisi di big data.
U mudellu cunsigliatu "ML-NPB-5660" per a maschera di dati
4. cumunimenti usatu Data Masking Tecnica
(1). Tecniche Statistiche
Campionamentu di dati è aggregazione di dati
- Sampling di dati: L'analisi è a valutazione di u settore di dati uriginale scegliendu un sottumessu rappresentativu di u settore di dati hè un metudu impurtante per migliurà l'efficacità di e tecniche di de-identificazione.
- Aggregazione di dati: Cum'è una cullizzioni di tecniche statistiche (cum'è summation, counting, averageing, maximum and minimum) applicate à l'attributi in microdata, u risultatu hè rappresentativu di tutti i registri in u set di dati originale.
(2). Criptografia
A criptografia hè un metudu cumuni per desensibilizà o rinfurzà l'efficacità di a desensibilizazione. Diversi tipi di algoritmi di criptografia ponu ottene diversi effetti di desensibilizazione.
- Cifratura deterministica: Una criptografia simmetrica non aleatoria. Di solitu processa e dati d'identità è pò decifrare è restaurà u testu cifratu à l'ID originale quandu hè necessariu, ma a chjave deve esse prutetta bè.
- Cifratura irreversibile: A funzione hash hè aduprata per processà e dati, chì hè generalmente utilizatu per i dati d'ID. Ùn pò micca esse decriptatu direttamente è a relazione di mappatura deve esse salvata. Inoltre, per via di a funzione di a funzione hash, pò accade una collisione di dati.
- Cifratura omomorfa: L'algoritmu omomorfu di u testu cifratu hè adupratu. A so caratteristica hè chì u risultatu di l'operazione di ciphertext hè u listessu cum'è quellu di l'operazione di testu chjaru dopu a decryption. Dunque, hè comunmente utilizatu per processà campi numerichi, ma ùn hè micca largamente utilizatu per ragioni di rendiment.
(3). Tecnulugia di u sistema
A tecnulugia di suppressione sguassate o scudi l'articuli di dati chì ùn anu micca a prutezzione di a privacy, ma ùn li publica micca.
- Masking: si riferisce à u metudu di desensibilizazione più cumuni per maschera u valore di l'attributu, cum'è u numeru di l'avversariu, a carta d'identità hè marcata cù un asteriscu, o l'indirizzu hè truncatu.
- Suppressione lucale: si riferisce à u prucessu di sguassà i valori di l'attributi specifichi (colonne), sguassate i campi di dati non essenziali;
- Suppressione di registrazione: si riferisce à u prucessu di sguassà registri specifichi (file), eliminazione di dati non essenziali.
(4). Pseudonym Technology
Pseudomanning hè una tecnica di de-identificazione chì usa un pseudonimu per rimpiazzà un identificatore direttu (o altru identificatore sensitivu). I tecnichi di pseudonimi creanu identificatori unichi per ogni sughjettu di l'infurmazioni individuali, invece di identificatori diretti o sensittivi.
- Pò generà valori aleatorii indipindentamente per currisponde à l'ID originale, salvà a tabella di mappatura, è cuntrullà strettamente l'accessu à a tabella di mappatura.
- Pudete ancu aduprà a criptografia per pruduce pseudonimi, ma avete bisognu di mantene a chjave di criptografia bè;
Sta tecnulugia hè largamente usata in u casu di un gran numaru d'utilizatori di dati indipendenti, cum'è OpenID in u scenariu di a piattaforma aperta, induve diversi sviluppatori ottennu Openids differenti per u stessu utilizatore.
(5). Tecniche di Generalizazione
A tecnica di generalizazione si riferisce à una tecnica di de-identificazione chì reduce a granularità di l'attributi selezziunati in un settore di dati è furnisce una descrizzione più generale è astratta di e dati. A tecnulugia di generalizazione hè faciule da implementà è pò prutege l'autenticità di e dati à livellu record. Hè cumunimenti usatu in i prudutti di dati o rapporti di dati.
- Arrotondamentu: implica a selezzione di una basa di arrotondamentu per l'attributu selezziunatu, cum'è a forensica à l'alza o à u discendente, chì rende risultati 100, 500, 1K è 10K
- Tecniche di codificazione in cima è in fondu: rimpiazzà i valori sopra (o sottu) u limitu cù un limitu chì rapprisenta u livellu superiore (o fondu), chì rende un risultatu di "sopra X" o "sottu X"
(6). Tecniche di randomizazione
Cum'è un tipu di tecnica di de-identificazione, a tecnulugia di randomizazione si riferisce à mudificà u valore di un attributu per via di randomizazione, perchè u valore dopu à randomizazione hè diversu da u valore reale originale. Stu prucessu reduce l'abilità di un attaccu per derivà un valore d'attributu da altri valori di attributu in u stessu registru di dati, ma affetta l'autenticità di e dati resultanti, chì hè cumunu cù e dati di teste di produzzione.
Tempu di pubblicazione: 27-sep-2022