Wat is RAID? De voor- en nadelen van 15 RAID-configuraties onthuld!
|
|
Tijd om te lezen 13 min
|
|
Tijd om te lezen 13 min
Opslagruimte is essentieel met de toenemende hoeveelheid data. Tegenwoordig kunnen AAA-games honderden gigabytes aan opslagruimte nodig hebben, terwijl een Blu-ray 4K HD-film 70/80 gigabytes kan bereiken. Zelfs de HDR-afbeeldingen en -video's die we met onze mobiele telefoons maken, nemen veel opslagruimte in beslag.
We kopen meestal een harde schijf als onze opslagruimte onvoldoende is. We kunnen echter te maken krijgen met het probleem van harde schijfpartities als er meer dan één harde schijf is. Voor belangrijke gegevens moeten we mogelijk handmatig back-ups van bestanden maken naar een andere harde schijf om de gegevensbeveiliging te vergroten.
Dus, hoe kunnen we gebruik maken van meerdere harde schijven? Door RAID te gebruiken kunnen we meerdere harde schijven gebruiken om de opslagcapaciteit en gegevensbeveiliging te vergroten.
RAID (Redundant Array of Cheap Disks) werd in 1988 voorgesteld door Prof. DA Patterson uit Berkeley, Californië. Het staat ook bekend als Redundant Array of Independent Disks.
RAID is de combinatie van meerdere onafhankelijke schijven in een schijfgroep met een grote capaciteit. Hierbij worden afzonderlijke schijven gebruikt om gegevens te leveren die door het additieve effect zijn gegenereerd om de prestaties van het gehele schijfsysteem te verbeteren. Tevens worden redundante gegevens opgeslagen om de fouttolerantie te vergroten.
Kortom, het biedt veel voordelen omdat het meerdere onafhankelijke harde schijven combineert tot een groep harde schijven met een grote capaciteit. Hierdoor worden de lees- en schrijfsnelheden aanzienlijk verhoogd en beschikt u over functies voor gegevensbescherming.
RAID kent verschillende niveaus en variaties, waaronder RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6, RAID F1, RAIDZ, JBOD, SHR, SHR2 en hybride RAID.
Afbeelding van www.ufsexplorer.com
RAID kan worden onderverdeeld in twee hoofdtypen: hardware-RAID en software-RAID.
Hardware RAID is er in twee vormen. Een externe RAID-behuizing is bijzonder duur en wordt meestal gebruikt voor enterprise storage. Een andere vorm is het toevoegen van een RAID-controllerkaart aan de computer.
Afbeelding van Wikipedia
RAID-controllerkaarten bieden hogere snelheden en meer stabiliteit dankzij de cache op de kaart, die de lees- en schrijfsnelheden kan verbeteren. De stabiliteit wordt verbeterd omdat de kwaliteitscontrollerkaarten zijn uitgerust met batterijen. De batterij van de controllerkaart kan ervoor zorgen dat de gegevens naar de harde schijf worden geschreven voordat deze stroom verliest, en biedt zo gegevensbeveiliging. Nieuwe controllerkaarten zijn duurder dan oude kaarten, die geschikt zijn voor mensen met een beperkt budget.
Afbeelding van Wikipedia
Ondanks de vele voordelen van hardware RAID, is er één mogelijke valkuil die we moeten vermijden: de RAID-functie die bij een moederbord wordt geleverd. Dit komt omdat de array verloren kan gaan in het geval van een moederbordprobleem, zoals mislukte overclocking of een lege batterij. De RAID die bij een moederbord wordt geleverd, komt niet eens in de buurt van het tweede type RAID - software RAID.
Software RAID is het gebruik van software om RAID te simuleren. Vroege RAID-versies zijn niet erg stabiel en de snelheid is niet zo snel als hardware RAID. Er is echter geen groot prestatieverschil meer tussen software RAID en hardware RAID met de continue optimalisatie van technologie. Software RAID is een veelvoorkomende keuze in veel NAS-apparaten voor thuisgebruik.
Het RAID-niveau begint bij 0 en loopt helemaal door tot 7. Laten we beginnen met RAID 0. Stel je harde schijven voor als buckets, en lees-/schrijfbewerkingen als het proces van het vullen van deze buckets met water. Deze analogie maakt het makkelijker om RAID te begrijpen.
Korte feiten over RAID 0
Voordelen : Snelle lees-/schrijfsnelheden (geen willekeurige lees-/schrijfsnelheden); maakt gebruik van alle ruimte op de harde schijf
Nadelen : Geen gegevensbescherming
Tip : RAID 0 kan niet worden gebruikt om belangrijke gegevens op te slaan
De lees-/schrijfsnelheid wordt beperkt door de interface van de harde schijf wanneer er maar één harde schijf is, vergelijkbaar met de grootte van een emmer die de snelheid van het vullen met water beperkt. U kunt tegelijkertijd water in beide emmers vullen en de lees-/schrijfsnelheid is twee keer zo snel als een enkele harde schijf. Dit is het RAID 0-opslagniveau.
RAID 0 combineert twee of meer schijven om één grote logische schijf te vormen met een totale capaciteit die gelijk is aan alle capaciteiten van de harde schijf. Wanneer gegevens worden geschreven, worden ze gesegmenteerd en opgeslagen op afzonderlijke schijven, waardoor meerdere schijven tegelijkertijd lees- en schrijfbewerkingen kunnen verwerken.
RAID 0 heeft een groot nadeel, ondanks de hoogste snelheid en de grootste capaciteit. De uitstekende snelheid resulteert in een gebrek aan redundantie en fouttolerantie. Alle gegevens gaan verloren en zijn niet meer te herstellen wanneer een van de harde schijven in de array beschadigd raakt. Omdat gegevens in segmenten worden opgeslagen, zal schade aan een van de harde schijven resulteren in onvolledig gegevensherstel. Daarom wordt het niet aanbevolen om RAID 0 te gebruiken voor het opslaan van belangrijke gegevens.
Afbeelding van Wikipedia
Korte feiten over RAID 1
Voordelen : Hoge beveiliging, geen gegevensverlies, zelfs niet als een van de schijven beschadigd raakt
Nadelen : Laag schijfgebruik, geen toename van de schrijfsnelheid
Welke RAID is geschikt voor het opslaan van belangrijke gegevens? RAID 1 is het veiligst en gebruikt twee harde schijven die elkaar spiegelen om dezelfde gegevens op elke schijf op te slaan. De volledige gegevens kunnen worden gelezen, zolang een van de harde schijven in de array niet is beschadigd. RAID 1 heeft dezelfde leessnelheid als RAID 0, maar de leessnelheid kan toenemen als er meerdere harde schijven worden gebruikt. De schrijfsnelheid is echter hetzelfde als die van een enkele harde schijf en kan niet worden verhoogd.
Een beschadigde harde schijf in RAID 1 kan worden losgekoppeld, waarna de array de gegevens automatisch herstelt op de nieuw geplaatste harde schijf. Dit proces staat bekend als het opnieuw opbouwen van de array.
Het probleem met RAID 1 is de relatief lage prijs-prestatieverhouding . Zelfs als u 100 harde schijven in RAID 1 gebruikt, is de uiteindelijke capaciteit slechts gelijk aan de capaciteit van één harde schijf. Als de grootte van elke harde schijf anders is, wordt de uiteindelijke capaciteit gebaseerd op de capaciteit van de kleinste harde schijf. De algehele benuttingsgraad van RAID 1 is de laagste van alle RAID-niveaus. RAID 0 en RAID 1 kunnen worden beschouwd als twee uitersten, waarbij RAID 0 ultrasnelle snelheden biedt, terwijl RAID 1 ultraveilig is.
U kunt RAID 2, 3, 4, 5 of 6 overwegen als u de capaciteit en beveiliging wilt vergroten, maar niet op snelheid let.
Afbeelding van Wikipedia
RAID 2, 3 en 4 zijn ontworpen voor specifieke toepassingen, maar worden zelden gebruikt. Bovendien ondersteunen veel controllerkaarten deze niveaus niet vanwege diverse tekortkomingen.
RAID 2 vereist ten minste drie harde schijven. Bij het lezen en schrijven van gegevens is het noodzakelijk om de gegevens in realtime te coderen en de gesegmenteerde gegevens naar verschillende harde schijven te schrijven. De totale hoeveelheid verkregen gegevens zal groter zijn dan de oorspronkelijke gegevens. Bovendien vereist RAID 2 realtime gegevenschecksums tijdens lees-/schrijfbewerkingen. De hardwareoverhead is hoger omdat het gebruikte checksumalgoritme complexer is.
RAID 3 vereist ten minste drie harde schijven en heeft een relatief lage hardware overhead vanwege eenvoudigere algoritmen. Tijdens lees- en schrijfbewerkingen worden gegevens in segmenten naar verschillende harde schijven geschreven, terwijl checksums afzonderlijk op een andere harde schijf worden opgeslagen. De checksum van een schijf moet echter voor elke lees- en schrijfbewerking worden benaderd, omdat deze gemakkelijk beschadigd raakt bij hoge belasting gedurende een lange periode. Gegevens kunnen niet worden hersteld wanneer de checksum van een schijf beschadigd is.
Afbeelding van Wikipedia
RAID 4 is vergelijkbaar met RAID 3, maar de gegevens worden op een andere manier gesegmenteerd. RAID 4 slaat ook pariteitsgegevens op een aparte harde schijf op. In tegenstelling tot RAID 3 wordt RAID 4 gesegmenteerd in blokken gegevens, waarvan de grootte wordt bepaald door het systeem en meestal veel groter is dan een bit. Het schrijven van kleine bestanden zal dus sneller zijn in RAID 4 dan in RAID 3. De kans op gegevensherstel op een beschadigde schijf zonder checksum is echter lager dan in RAID 3. Noch RAID 3 noch RAID 4 kan gegevens herstellen wanneer de checksum van een schijf beschadigd is.
Afbeelding van Wikipedia
RAID 5 is vergelijkbaar met RAID 3, behalve dat RAID 3 pariteitsgegevens opslaat op één harde schijf, terwijl RAID 5 pariteitsgegevens verspreidt over harde schijven. Gegevens op andere harde schijven en checksum kunnen samenwerken voor gegevensherstel wanneer één harde schijf beschadigd is, in tegenstelling tot RAID 3 waarbij een beschadigde checksum ervoor zorgt dat de hele array faalt.
Afbeelding van Wikipedia
RAID 5 vereist ten minste drie harde schijven. Een derde van de ruimte wordt gebruikt om redundante informatie of checksum op te slaan, terwijl twee derde wordt gebruikt om ruwe data op te slaan. De leessnelheid van RAID 5 is vergelijkbaar met die van RAID 0, maar de schrijfsnelheid is mogelijk niet zo snel als RAID 0. Gegevens en checksums op de andere harde schijven kunnen echter worden gebruikt om volledige data recovery te bereiken, zelfs als een van de harde schijven in de array is beschadigd, aangezien een derde van de ruimte wordt gebruikt voor het opslaan van checksums. Daarom is RAID 5 veiliger dan RAID 0.
RAID 5 heeft een hogere beveiliging, maar ook nadelen. Ten eerste is de kans erg klein dat een mechanische harde schijf een onherstelbare leesfout (URE) tegenkomt bij het lezen van gegevens, wat eens per 12 TB aan gegevens kan voorkomen. Het kost slechts één URE-fout voordat RAID 5 denkt dat er iets mis is met de gegevens en de array opnieuw begint op te bouwen.
Meerdere herbouwingen kunnen ervoor zorgen dat de harde schijven gedurende lange perioden onder hoge belasting werken. Als de schijven tegelijkertijd zijn gekocht en één schijf defect raakt, kan de status van de andere schijven ook instabiel worden, wat leidt tot verdere schade aan de schijf.
Omdat RAID 5 slechts één harde schijf toestaat beschadigd te raken, worden gegevens niet opgeslagen als een andere harde schijf beschadigd raakt tijdens het herbouwproces. Het wordt niet aanbevolen om RAID 5 te gebruiken, omdat het een laag succespercentage heeft bij het herbouwen van arrays en slechte beveiliging in vergelijking met RAID 6.
RAID F1 heeft een array-indeling op basis van RAID 5 en is ontworpen voor solid-state drives (SSD's). RAID F1 is geoptimaliseerd voor SSD-schrijfslijtage en slaat checksums op in één SSD om de hoeveelheid schrijfbewerkingen naar andere SSD's te minimaliseren. Het systeem ondersteunt automatische gegevensoverdracht wanneer de SSD zijn schrijflimiet nadert. RAID F1 is echter meestal niet toegankelijk voor het publiek vanwege de hoge SSD-prijzen.
RAID 6 en RAID 5 zijn twee veelvoorkomende RAID-niveaus. Vergeleken met RAID 5 voegt RAID 6 redundante harde schijfruimte toe voor pariteitsgegevens en vereist het ten minste vier harde schijven.
RAID 6 heeft een hoge gegevensbeveiliging omdat er twee verschillende checksum-algoritmen worden gebruikt, wat zorgt voor volledig gegevensherstel, zelfs als twee harde schijven beschadigd zijn. In vergelijking is RAID 5 minder veilig. De hoeveelheid checksums in RAID 6 is echter twee keer zo groot als RAID 5, omdat de eerste twee checksum-algoritmen gebruikt die rekenintensiever zijn. Dit betekent dat RAID 6 niet zo snel kan lezen of schrijven als RAID 5.
Afbeelding van Wikipedia
Bent u niet tevreden met RAID 0 tot en met 6 en wilt u weten of er RAID-typen zijn die de voordelen van alle niveaus bieden? Lees dan verder voor meer informatie over hybride RAID.
RAID 10 is de meest voorkomende hybride RAID. Door de RAID 1- en RAID 0-modi te combineren, zorgt RAID 10 voor gegevensbeveiliging en verhoogt het de lees- en schrijfsnelheden aanzienlijk, maar de beschikbare capaciteit is slechts de helft van de totale capaciteit.
Voor RAID 10 zijn minimaal vier harde schijven nodig, waarvan er twee worden gebruikt om RAID 1 te vormen en nog eens twee om RAID 0 te vormen.
Naast RAID 10 zijn er RAID 50 en RAID 60 arrays. RAID 50 is een combinatie van RAID 5 en RAID 0, die RAID 5 gebruikt om gegevens en pariteitsinformatie op meerdere harde schijven op te slaan en deze harde schijven combineert om een grote gestreepte opslagruimte te vormen met RAID 0, waardoor de opslagcapaciteit en lees-/schrijfprestaties worden vergroot. RAID 60 is een combinatie van RAID 6 en RAID 0 en hanteert een vergelijkbare aanpak om de opslagcapaciteit en lees-/schrijfprestaties te vergroten en tegelijkertijd betere gegevensredundantie en beveiliging te bieden.
JBOD, wat staat voor just a bunch of disks, gebruikt een speciaal dataopslagmodel. In JBOD worden data sequentieel op disks opgeslagen, beginnend met de eerste disk. Slechts één grote partitie met de capaciteit van alle harde schijven is zichtbaar in het systeem. Data is echter ontoegankelijk als een van de harde schijven kapotgaat. Erger nog, de hele array is kapot als de eerste harde schijf beschadigd is, omdat dit de enige opslaglocatie is voor datasegmentatie.
Het voordeel van JBOD is dat het meerdere harde schijven als één geheel behandelt, waarbij de totale capaciteit van de schijven beschikbaar is voor gebruik. Bovendien wordt er slechts één schijf per schrijfbewerking gebruikt. Dit betekent dat de andere schijven inactief zijn tijdens lees- en schrijfbewerkingen en overmatig gebruik geen schade veroorzaakt. JBOD heeft echter aanzienlijke nadelen. De gegevensbeveiliging is relatief laag, aangezien het falen van een harde schijf kan leiden tot gegevensverlies. Ten tweede moeten de lees- en schrijfsnelheden nog verbeteren en hetzelfde blijven als die van een enkele harde schijf. Daarom wordt JBOD niet aanbevolen voor toepassingen die een hoge gegevensbeveiliging en lees-/schrijfprestaties vereisen.
Unraid is een Linux-gebaseerd besturingssysteem dat vergelijkbaar is met JBOD en dat dataredundantie ondersteunt. In Unraid kunnen één of twee harde schijven worden ingesteld voor dataverificatie. Er is een grotere capaciteit nodig om data te herstellen als één of twee harde schijven defect raken.
Unraid biedt handige capaciteitsuitbreiding, omdat gebruikers alleen een nieuwe harde schijf in het systeem hoeven te plaatsen om de opslagruimte uit te breiden. Zelfs als er meer dan één harde schijf kapot is, gaan alleen de gegevens op de beschadigde harde schijf verloren. De andere schijven in de array kunnen nog steeds normaal functioneren.
Unraid heeft echter twee grote nadelen die het gebruik ervan beperken. Ten eerste is het belastbaar, prijzen variëren van 59-129, wat relatief goedkoop is. Net als JBOD heeft Unraid lagere schrijfsnelheden omdat de extra checksum-bewerking de schrijftijd vergroot. In feite zijn de schrijfsnelheden van Unraid mogelijk zelfs lager dan die van JBOD, de langzaamste van alle arrays.
Desondanks biedt Unraid veel opslagruimte, waardoor het ideaal is voor gebruikers die geen hoge prestaties nodig hebben.
Synology Hybrid RAID (SHR) is een unieke array-modus, die vooral bedoeld is voor nieuwe gebruikers die nog niets van arrays weten. SHR kan automatisch de juiste RAID-modus bepalen en gebruiken op basis van het aantal en de capaciteit van de harde schijven.
In SHR wordt de capaciteit van één harde schijf standaard gebruikt om verificatiegegevens op te slaan. Als elke harde schijf dezelfde capaciteit heeft en er maar één harde schijf wordt gebruikt, is SHR gelijk aan een normale harde schijf zonder enige gegevensbescherming. Wanneer er twee harde schijven worden gebruikt, neemt SHR een modus aan die vergelijkbaar is met RAID 1. SHR is vergelijkbaar met RAID 5 wanneer er drie harde schijven worden gebruikt. SHR 2 slaat checksums op in twee harde schijven en vereist vier harde schijven, vergelijkbaar met RAID 6.
Met SHR is het eenvoudig om één tot twee redundante arrays van schijven te upgraden, wat meer flexibiliteit biedt dan conventionele RAID. Gegevensherstel kan echter alleen worden uitgevoerd in GroupHi, aangezien SHR een speciale modus is voor GroupHi. Er is gespecialiseerde software nodig voor gegevensherstel, aangezien harde schijven die in andere computers worden gebruikt, mogelijk niet rechtstreeks gegevens kunnen lezen. Dergelijke software heeft echter bepaalde beperkingen op gegevensherstel.
RAID Z is een software-RAID gebaseerd op het ZFS-systeem. ZFS is een 128-bits bestandssysteem dat geavanceerde functies ondersteunt, waaronder:
RAID Z is een van de features van ZFS, waarbij geen extra software of hardware nodig is om RAID te realiseren. Er zijn drie typen RAID Z: RAID Z1, RAID Z2 en RAID Z3.
Gecombineerd met de functies van ZFS is RAID Z een uitstekende optie. RAID Z heeft echter ook enkele nadelen, waaronder een hoog geheugengebruik. ZFS moet veel geheugen gebruiken voor caching, elke T aan ruimte is het beste om overeen te komen met 1G geheugen, anders zal de prestatie worden beïnvloed. Het wordt aanbevolen om te beginnen met ten minste 8G. Het is ook van vitaal belang om foutcorrectiecodegeheugen te gebruiken, anders zal het resulteren in een lage kans op datafouten.
Het tweede nadeel is de uitbreiding van de capaciteit. Er moet nog een groep van maximaal zes harde schijven worden toegevoegd als er een derde harde schijf is gevormd tot RAID Z1. Het is niet zo handig als RAID 5 en RAID 6, waarbij een nieuwe harde schijf kan worden gebruikt om de capaciteit uit te breiden.
In dit artikel hebben we het concept van RAID's uiteengezet, evenals de voor- en nadelen van 15 verschillende RAID-niveaus. Door de kenmerken van verschillende RAID-niveaus te begrijpen, kunnen gebruikers een opslagoplossing kiezen die past bij hun behoeften en de beveiliging en betrouwbaarheid van gegevens verbeteren.