Das InfoTip Kompendium

Ein kostenloser Service der InfoTip Service GmbH

Zum Anfang der
Seite scrollen

RAID - Datensicherheit durch Redundanz - Grundlagen Informationstechnik

Inhaltsverzeichnis

1. Allgemeines

Die Abkürzung RAID stand ursprünglich für die englische Bezeichnung „Redundant Array of Inexpensive Disks“ (= Redundante Anordnung kostengünstiger Festplatten). Später wurde aus Marketinggründen die Technologie in „Redundant Array of Independent Disks“ (= Redundante Anordnung unabhängiger Festplatten“) umbenannt. Der Begriff RAID wurde 1987 von drei Informatikern der University of California, Berkley geprägt (siehe [1].

Das Prinzip

Das Grundprinzip von RAID ist es mehrere physische Festplatten zu einem logischen Laufwerk zusammenzufassen, wobei das logische Laufwerk erweiterte Speicherfunktionen und eine höhere Datensicherheit durch Redundanz, z.B. beim Ausfall einer oder mehrerer Festplatten, aufweisen soll. Die Bezeichnung RAID wird heute pauschal für eine ganze Reihe von Datenspeicher-Modellen, in denen die Daten auf mehrere physische Festplatten verteilt und repliziert werden, angewendet. Die physischen Festplatten werden hierzu in einem Festplatten-Verbund (Disk Array) zusammengefasst, das vom Betriebssystem des Computer wie ein einziges, virtuelles Laufwerk betrachtet wird.
Die unterschiedlichen Speicher-Modelle (Level) sind mit der Bezeichnung RAID, gefolgt von einer Zahl benannt. Jedes Speicher-Modell bietet einen Kompromiss zwischen hohem Datendurchsatz und Zuverlässigkeit, wobei  die Schwerpunkte unterschiedlich gewichtet sein können.

Abb. 1.01: PCI-RAID-Controller-Karte für vier SATA-Festplatten (2005)
Abb. 1.01: PCI-RAID-Controller-Karte für vier SATA-Festplatten (2005)

Die einzelnen Festplatten in einem RAID-Verbund sollten immer die gleiche Größe und die gleichen Leistungsmerkmale aufweisen. Die kleinste und die langsamste Festplatte im Verbund bestimmen dessen Eigenschaften. Das Zusammenführen von einzelnen Festplatten zu RAID-Verbünden wird mit Hardware-RAID-Controllern vorgenommen. Auf dem Mainboard integriert oder als Steckkarte klinken sie sich in das BIOS (Basic Input/Output System) ein und stellen so dem Betriebssystem die notwendigen Funktionen zur Verfügung. In PCs ab etwa 2005 ist die RAID-Software zumeist standardmäßig im BIOS bereits integriert.

Fällt eine Festplatte aus, kann diese  durch eine neue ersetzt werden. In professionellen EDV-Anlagen werden zu diesem Zweck Reservefestplatten bereitgehalten, die während des Betriebes ausgetauscht werden können (Hot Swop) oder sich sogar automatisch einbinden (Hot Spare).  Die Rekonstruktion des Systems erfolgt anschließend durch Umkopieren (Rebuild) der Daten auf die neue Festplatte.

RAID-Verbunde sind ein effektiver Schutz vor dem physischen Ausfall einer Festplatte. Da der Verbund aber vom Betriebssystem wie ein einzelnes logisches Laufwerk behandelt wird, bietet es keinen Schutz vor Datenverlust durch Virenbefall, irrtümliches Überschreiben oder Löschen. Wichtige Daten oder Verzeichnisse müssen daher zusätzlich auf ein externes Backup-Medium gesichert werden.

In diesem Artikel werden nur die wichtigsten und gebräuchlichsten RAID-Verfahren angesprochen. Neben diesen gibt es noch eine Unzahl weiterer, die aber durch die Weiterentwicklung der Technik überflüssig geworden sind und nicht mehr zum Einsatz kommen (siehe [2]).

2. Die RAID-Level

2.1. Standard RAID-Level

RAID 0 - Beschleunigung durch Striping, keine Redundanz

Abb. 2.01: RAID-Level 0
Abb. 2.01: RAID-Level 0

RAID 0 ist im eigentlichen Sinne kein RAID, denn die Daten werden nicht redundant gespeichert (keine Spiegelung, keine Paritäten). Es ist lediglich ein Verbund von unabhängigen Platten (Array of Independent Disks / JBOD = Just a Bunch Of Disks (Nur ein Haufen Festplatten)). Das Ziel von RAID 0 ist eine Maximierung des Datendurchsatzes. Hierzu werden die Daten in Form von mehreren zusammenhängenden Blöcken (Stripes = Streifen) abwechselnd auf die Festplatten geschrieben. Dabei kann auf beide Festplatten parallel zugegriffen werden, was die gewünschte Geschwindigkeitssteigerung bewirkt.
Da bei RAID 0 die Redundanz fehlt, ist es nur für Anwendungen empfehlenswert, wo die Datensicherheit weniger wichtig ist. Denn der Ausfall von nur einer Festplatte im Verbund zerstört alle im Verbund befindlichen Daten. RAID 0 wird heute meist in nur lesenden Anwendungen, z.B. Zuspielern für Video, eingesetzt.

RAID 1 - Spiegelung (Mirroring)

Abb. 2.02: RAID-Level 1
Abb. 2.02: RAID-Level 1

Ein RAID 1-Verbund besteht aus mindestens zwei Festplatten. Die Daten werden identisch auf mehrere Festplatten geschrieben ("gespiegeltes Paar"). Jede Festplatte enthält eine komplette Kopie der Daten und kann für sich separat angesprochen werden.
Durch die Spiegelung der Daten liegt der maximale Nutzungsgrad des Arrays bei 50%, was die Kosten der  Datenhaltung mit RAID 1-Verbunden verdoppelt. Aber aufgrund der Einfachheit und den günstigen Preisen, auch für große Festplatten, ist die RAID 1-Technologie das Verfahren der Wahl für die kleine EDV und in Multimedia-Netzwerken, z.B. bei NATs (Network Attached Storage).

RAID 5 - Leistungssteigerung durch Striping und Redundanz durch Parität

Abb. 2.03: RAID-5 mit vier Festplatten
Abb. 2.03: RAID-5 mit vier Festplatten

Bei großen Datenmengen, die redundant gespeichert werden müssen, ist ein RAID 0-Verbund nicht verwendbar und RAID 1 aufgrund der benötigten großen Festplatten recht teuer. In diesem Fall bietet sich RAID 5 an. Wie RAID 0 speichert RAID 5 die Daten in blockgroßen Stripes und zusätzlich Paritätsdaten (ECC = Error Correction Code) für eine eventuelle spätere Fehlerkorrektur. Die Datenblöcke und die Paritätsblöcke sind über alle Festplaten des Arrays verteilt. Durch diese Konfiguration erhalten RAID 5-Arrays die Sicherheit wie RAID 1-Verbünde und nahezu die gleichen Datendurchsatzraten wie RAID 0-Verbünde weil die Daten von mehreren Laufwerken parallel gelesen werden können. Die Paritätsinformationen brauchen beim Lesen der Daten nicht entschlüsselt werden; sie werden nur dann benötigt, wenn eine Festplatte ausfällt und die fehlenden Daten rekonstruiert werden müssen.
Zur Berechnung der Parität wird durch die jeweils an gleicher Adresse anliegenden Datenblöcke der am RAID-Verbund beteiligten Festplatten eine logische Gruppe gebildet. Von allen Datenblöcken einer Gruppe enthält ein Datenblock die Paritätsdaten, während die anderen Datenblöcke Nutzdaten enthalten. Die Berechnung der Paritätsdaten eines Paritätsblocks erfolgt durch XOR-Verknüpfung der Daten aller Datenblöcke in einer Gruppe. 

Das Berechnen der Paritäten erfordert zwar Zeit, was aber bei weitem durch den parallelen Schreibzugriff ausgeglichen wird. RAID 5-Arrays werden daher gern in Datenbank-Servern eingesetzt.
Durch die Verwendung von Paritätsdaten statt Kopien (wie bei RAID 1) steigt der maximale Nutzungsgrad auf ca. 80% der Gesamtspeicherkapazität und reduziert somit die Kosten der Festplatten deutlich. Ein RAID 5-Array benötigt mindestens drei Festplatten.

 

2.2. Kombinierte RAID-Level  

Bei der Kombination von RAID-Levels werden unterschiedliche Standard-RAID-Level so verschachtelt, dass sich die jeweiligen Eigenschaften summieren. Typischerweise werden Level mit Redundanz mit Level, die eine hohe Datendurchsatzrate bieten verknüpft.

RAID 01 (RAID  0+1)

Abb. 2.04: RAID-01 mit vier Festplatten
Abb. 2.04: RAID-01 mit vier Festplatten

Ein RAID-01-Verbund ist ein RAID 1 über mehrere RAID 0-Arrays. Es werden dabei die Eigenschaften der beiden RAIDs kombiniert: Sicherheit durch Spiegelung und gesteigerter Datendurchsatz durch Striping.
RAID 01-Verbünde können zwar schon über drei Festplatten gelegt werden, üblicherweise werden aber vier Festplatten verwendet. Jeweils zwei Festplatten werden zu je einem RAID 0-Verbund konfiguriert. Im übergeordneten RAID 1-Verbund werden dann die Daten des ersten RAID 0-Paares auf das zweite Paar kopiert. 
Ein Manko der Konfiguration ist, dass die RAID-1-Schicht einer RAID-01-Implementation nicht in der Lage ist, einen Schaden in einem untergeordneten RAID 0 differenziert den einzelnen Festplatten zuzuordnen.
Durch die Spiegelung der Daten liegt der maximale Nutzungsgrad des Arrays bei 50%.

 

RAID 10 (RAID 1+0)

Abb. 2.05: RAID-10 mit vier Festplatten
Abb. 2.05: RAID-10 mit vier Festplatten

Ein RAID 10-Verbund ist ein RAID 0 über zwei oder mehrere RAID 1-Arrays. Wie beim RAID 01 werden die Eigenschaften der beiden RAID-Verfahren kombiniert: Sicherheit durch Spiegelung und gesteigerter Datendurchsatz durch Striping. Ein RAID-10-Verbund benötigt mindestens vier Festplatten.
Während die RAID-1-Schicht einer RAID-01-Implementation nicht in der Lage ist, einen Schaden in einem untergeordneten RAID 0 explizit den einzelnen Festplatten zuzuordnen, bietet RAID 10 eine bessere Ausfallsicherheit und schnellere Rekonstruktion nach einem Plattenausfall, da nur ein Teil der Daten rekonstruiert werden muss. Auch hier hat man, wie bei RAID 1 und RAID 01, nur die Hälfte der gesamten Festplattenkapazität zur Verfügung.

 

RAID 15 (RAID 1+5)

Abb. 2.06: RAID-15 mit sechs Festplatten
Abb. 2.06: RAID-15 mit sechs Festplatten

Ein RAID 15-Array setzt sich aus mindestens drei RAID 1-Verbunden (also mindestens sechs Festplatten) zusammen. Die übergeordnete Verwaltungsstruktur entspricht dem RAID 5-Konzept. Der Datendurchsatz und die Datensicherheit sind gut. Theoretisch können bis zu drei Festplatten gleichzeitig (allerdings nur jeweils eine pro RAID 1-Paar) ausfallen ohne dass es zu Datenverlusten kommt.

 

RAID 51 (RAID 5+1)

Abb. 2.07: RAID-51 mit sechs Festplatten
Abb. 2.07: RAID-51 mit sechs Festplatten

Der RAID-51-Verbund ähnelt dem RAID 15. Es wird lediglich  die gesamte Struktur eines RAID 5-Arrays gespiegelt. Ein solcher Verbund benötigt somit mindestens sechs Festplatten. Die Qualitäten und die Kosten eines solchen Arrays sind ähnlich zum RAID 15.

 

 

Referenzen

Weblinks

[1] A case for redundant arrays of inexpensive disks (RAID), D. A. Patterson, G. Gibson und R. H. Katz, 1988
[2] Kapitel "Weniger gebräuchliche oder bedeutungslos gewordene RAID-Level" im Artikel "RAID" in der Wikipedia: http://de.wikipedia.org/wiki/RAID

Rechtshinweis

Sofern auf dieser Seite markenrechtlich geschützte Begriffe, geschützte (Wort- und/oder Bild-) Marken oder geschützte Produktnamen genannt werden, weisen wir ausdrücklich darauf hin, dass die Nennung dieser Marken, Namen und Begriffe hier ausschließlich der redaktionellen Beschreibung bzw. der Identifikation der genannten Produkte und/oder Hersteller bzw. der beschriebenen Technologien dienen.

Alle Rechte an den in diesem Kompendium erwähnten geschützten Marken- und/oder Produktnamen sind Eigentum der jeweiligen Rechteinhaber und werden hiermit ausdrücklich anerkannt. Alle in unseren Artikeln genannten und ggfs. durch Dritte geschützte Marken- und Warenzeichen unterliegen uneingeschränkt den Bestimmungen des jeweils gültigen Kennzeichenrechts sowie den Besitzrechten der jeweiligen eingetragenen Eigentümer.

Die Nennung von Produktnamen, Produkten und/oder der jeweiligen Produkthersteller dient ausschließlich Informationszwecken und stellt keine Werbung dar. InfoTip übernimmt hinsichtlich der Auswahl, Leistung oder Verwendbarkeit dieser Produkte keine Gewähr.

Sollten dennoch wider unserer Absicht Rechte Dritter verletzt werden, so bitten wir um eine Benachrichtigung ohne Kostennote.