Als softwareontwikkelaars moeten wij regelmatig testen met kopieën van de productiedatabases van onze klanten. Uit oogpunt van dataveiligheid is het niet wenselijk dat deze databases daadwerkelijk productiedata bevatten. Daarom is het nodig om de gegevens te anonimiseren.
Echter, het is niet voldoende om een tabel met volledig willekeurige gegevens te vullen. Om de werking van een applicatie te kunnen testen moet de data wel realistisch zijn.
Dat houdt in dat er in de tabellen niet alleen gekeken moet worden naar de datatypes, maar ook naar de betekenis van de velden. Bij voorbeeld: voornaam, tussenvoegsel, achternaam, email adres. Deze velden kunnen niet met willekeurige reeksen letters worden gevuld, maar moeten voor de ontwikkelaar zo veel mogelijk als zodanig herkenbaar blijven.
Ook moet er rekening gehouden worden met gerelateerde informatie in de database. Bij voorbeeld: een bedrijfsnaam zou terug kunnen komen in een email adres.