Archiwizacja i kopia zapasowa Deduplikacja danych

Deduplikacja danych

Grzegorz Bielawski
. 8 lipca 2011
. Update: 30 maja 2013 19:28

Deduplikacja danych polega na znalezieniu takich samych bloków danych w różnych plikach. Ich ilość w firmie potrafi osiągać nawet kilkadziesiąt procent. Identyczne bloki są wyszukiwane za pomocą zaawansowanych algorytmów, a następnie tworzona jest baza danych o zdublowanych blokach.

Deduplikacja danych to oszczędność. Deduplikacja opłaca się, jeżeli w bazie zostanie zidentyfikowanych już 10% dubletów (powtarzających się bloków). Oznacza to, że jeżeli z bazy 1000 plików wykluczymy więcej niż 10% powtarzające się bloków, to zwróci się koszt deduplikacji, a znalezienie każdego kolejnego dubletu jest już czystym zyskiem.

Co nam daje w praktyce ?

W przypadku backupu danych przez sieć kopia wykonuje się znacznie szybciej i co więcej oszczędzamy też miejsce na dysku.

Tags:deduplikacja danych