Deduplikacja danych polega na znalezieniu takich samych bloków danych w różnych plikach. Ich ilość w firmie potrafi osiągać nawet kilkadziesiąt procent. Identyczne bloki są wyszukiwane za pomocą zaawansowanych algorytmów, a następnie tworzona jest baza danych o zdublowanych blokach.
Deduplikacja danych to oszczędność. Deduplikacja opłaca się, jeżeli w bazie zostanie zidentyfikowanych już 10% dubletów (powtarzających się bloków). Oznacza to, że jeżeli z bazy 1000 plików wykluczymy więcej niż 10% powtarzające się bloków, to zwróci się koszt deduplikacji, a znalezienie każdego kolejnego dubletu jest już czystym zyskiem.
Co nam daje w praktyce ?
W przypadku backupu danych przez sieć kopia wykonuje się znacznie szybciej i co więcej oszczędzamy też miejsce na dysku.