Rozpoczęła się era post-RAID, podczas gdy macierze RAID wcale nie odchodzą do lamusa.
Dlaczego teraz?
Alternatywa dla RAID istnieje już od dawna.
- Autorzy oryginalnego dokumentu opisującego RAID (Patterson, Gibson i Katz), który powstał w 1988, pracują nad nowymi projektami: Patterson nad skalowalnym przechowywaniem obiektów; Gibson założył własną firmę zajmujące skalowalnym przechowywaniem obiektów; natomiast Katz pracuje nad Hadoop i wieloma pokrewnymi projektami.
- Prawdopodobnie najszybciej rozwijającymi się infrastrukturami do przechowywania danych na świecie to Google i Amazon – co je łączy, nie bazują tylko na technologi RAID.
- Główni producenci serwerów NetApp, HP, EMC i Hitachi zainwestowali – i sprzedają – systemy bez RAID.
- To wszystko przez kody „erasure Reed-Solomon”
Jak działają kody erasure?
RAID wykorzystuje kody „erasure” do tworzenie informacji parzystości, które chronią macierz RAID przed URE (uncorrectable read errors).
Kody „erasure” rozbijają dane na n segmentów, dodając m dodatkowych fragmentów, przechowując n+m na różnych urządzeniach potrafią odtworzyć dane z każdego n urządzeń. W RAID5 skonfigurowanym na 8 dyskach, oryginalne dane są podzielone na 7 fragmentów, a ósmy fragment to – informacja parzystości – każdy z 8 dysków może ulec awarii, a my teoretycznie nie powinniśmy stracić żadnych danych.
Problem z RAID5 jest taki, że przy zastosowaniu dużych dysków, czas potrzebny na odbudowę macierzy, jest bardzo duży, co zwiększa ryzyko wystąpienia kolejnego URE podczas odbudowy, tym samym powodując utratę danych. W dzisiejszych czasach podstawa to zabezpieczenie przed dwoma URE.
W latach 90-tych powstała nowa forma kodów „erasure”, która umożliwiła tworzenie kodów z dowolną redundancją – zwanych jako kody „fountain” lub „ratelesserasure”. Startupy takiej jak Digital Fountain, Cleversafe i Amplidata postanowiły skorzystać z możliwości jakie dają nowe kody.
Poniższe wideo zamieszczone przez StorageMojo pokazuje plusy wykorzystywania kodów „rateless”, używanych przez Amplidata. Jedną z głównych zalet to redundancja zapewniająca przetrwanie 4 awarii. Czyli znacznie lepiej niż 3 x krotna replikacja jaką wykorzystują w swojej infrastrukturze Amazon i Google.
Mimo iż wiele firm nadal inwestuje w RAID, to teraz mamy nowe, lepsze rozwiązanie. Sprzedawane w odpowiedniej cenie może być kolejnym krokiem milowym w rozwoju infrastruktury „storage”.
Poniżej inne wideo pokazujące jak kody erasure można wykorzystać do ochrony danych w infrastrukturze cloud storage.
Jeżeli chodzi o cloud storage i wykorzystanie technologii kodów „erasure” do zabezpieczenia danych w chmurze to jako świetny przykład można tutaj przetoczyć rozwiązania CTERA Protal firmy CTERA Networks.
CTERA Portal to skalowalna platforma, świadcząca usługę cloud storage, umożliwiająca wykonywanie kopii zapasowych z urządzeń zdalnych na serwer centralny. Ctera Portal umożliwia zdalne zarządzanie zdalnymi serwerami Ctera z serii CloudNAS (C800,C400, C200, CloudPlug), scentralizowany monitoring wszystkich urządzeń podpiętych do portalu i udostępnia interfejs webowy do zarządzania usługą kopii zapasowej online.