Weizenfeld

Speichersysteme - Storage und RAID


Autoren: D. Supper, A. Grella, Elektronikschule Tettnang, 2024

Ein Speichersystem (engl. storage) dient zur Speicherung von IT-Daten. Es besteht aus Software zur Verwaltung des Speichers und der Hardware zum Speichern der Daten.

In diesem Artikel wird der Aufbau von Speichersystemen, insbesondere RAID-Systemen erklärt.

Speichersysteme - Definition und Klassifizierung

Ein Speichersystem (engl. storage) dient zur Speicherung von IT-Daten. Es besteht aus Software zur Verwaltung des Speichers und der Hardware zum Speichern der Daten. Das System funktioniert somit eigenständig und verwaltet den ihm zur Verfügung gestellte Speicherkapazität.

Man unterscheidet zwischen Primärspeicher und Sekundärspeicher. Während der Primärspeicher direkt angeschlossen ist oder über ein Netzwerk zur Verfügung gestellt wird der Sekundärspeicher über Wechselmedien bereitgestellt

Primärspeicher wird wie folgt eingeteilt:

  • DAS - direct attached storage
  • NAS - network attached storage
  • SAN - storage area network (speparates Speichernetzwerk)

DAS - direct attached storage

  • direkte Verbindung zwischen Speicher und Server
  • Schnittstellen: SAS (Serial Attached SCSI mit 12 Gbit/s und 10 m) und FC (fibre channel mit 16 Gbit/s und 2 km)
  • Vorteile: schnelle kostengünstige Lösung, über VM auch mehrere Server anschließbar
  • Nachteile: pro Kanal nur ein Server

NAS - network attached storage

  • einfach per LAN erreichbar
  • Schnittstellen: Gigabit-Ethernet und iSCSI (internet SCSI over TCP/IP)
  • Vorteile: schnelle kostengünstige Lösung, geringer Energieverbrauch
  • Nachteile: geringe Skalierbarkeit und geringe Leistungsfähigkeit (nur SOHO)

SAN - storage area network

  • eigenes performantes Netzwerk zur Anbindung von Speichersystemen
  • Schnittstellen: FC (Fibre Channel mit 16 Gbit/s, bis 2 km), FCoE (Fibre Channel over Ethernet mit 10 Gbit/s), iSCSI (Internet SCSI = SCSI over TCP/IP)
  • Vorteile: alle im SAN befindlichen Server können drauf zugreifen, hohe Skalierbarkeit, Trennung zwischne SAN und LAN
  • Nachteile: hohe Kosten, speparate Hardware

Datenverlust und RAID- Ursachen und Abhilfe

Einer der häufigsten Ursachen für Datenverluste sind Hardwareprobleme und menschliches Versagen. Dies geht aus einer Studie von Kroll Ontrack aus den Jahren 2005 und 2010 hervor (s. Abb. 1.1 und Abb. 1.2).

Abb. 1.1: Mit 59 % ist der Hardwarefehler die häufigste Ursache für den Datenverlust. Statistische Auswertung von Kroll Ontrack von Angaben aus Datenrettungslaboren 2005. Quelle: Knoll Ontrack
Abb. 1.2: 40 Prozent der von Kroll Ontrack Befragten sehen im Menschen die größte Fehlerquelle im Jahr 2010. Quelle: Knoll Ontrack

Einer der häufigsten Ursachen für Datenverluste sind Hardwareprobleme und menschliches Versagen. Dies geht aus einer Studie von Kroll Ontrack aus den Jahren 2005 und 2010 hervor (s. Abb. 1.1 und Abb. 1.2).

Um diesen Ursachen zu begegnen wurde RAID (engl. redundant array of independent disks) entwickelt. Das Ziel von RAID ist ein Datensicherungskonzept mit Redundanz, um die Ausfallsicherheit zu erhöhen, ein schneller Zugriff auf die Daten und eine schnelle Wiederherstellung beim Ausfall eines Speichers sicherzustellen.

RAID 0 und RAID 1 - Zugriffsrate versus Redundanz




Abb. 2.1: RAID 0 mit 2 Festplatten. Die Daten werden verteilt gespeichert.

RAID 0 - striping

Die Bytes werden auf mehreren Festplatten (s. Abb. 2.1) verteilt gespeichert. Durch den parallelen Zugriff auf die Speicher verringert sich die Zugriffszeit.

➕ Die Durchsatzrate ist erhöht: paralleler Zugriff
➖ Die Datensicherheit ist reduziert: Fällt eine Platte aus sind alle Daten verloren.

RAID 1 - mirroring

Die Bytes werden redundant auf mehrere Festplatten (s. Abb. 2.2) verteilt gespeichert. Durch die Spiegelung der Daten auf mehrere Platten sind bei einem Plattenausfall die Daten noch vorhanden.

➕ Die Daten sind durch Redundanz doppelt gesichert
➖ Die Durchsatzrate ist niedrig.




Abb. 2.2: RAID 1 mit 2 Festplatten. Die Daten werden gespiegelt.

RAID 5 - Redundanz bei niedrigen Kosten





Abb. 3: RAID 5 mit vier Festplatten. Durch das Paritybyte können beim Ausfall einer Festplatte die Daten wiederhergestellt werden.

Die Daten werden auf mindestens zwei Festplatten parallel mit einer zusätzlichen Festplatte für das Paritybyte gespeichert. In Abb. 3 sieht man ein Beispiel mit insgesamt 4 Festplatten. Das Paritybyte, was aus den Daten der anderen Festplatten berechnet wird, gewährleistet die Datensicherheit beim Ausfall einer Platte, reduziert aber durch den Berechnungsaufwand trotz parallelen Schreibens die Durchsatzrate.

Das Paritybyte wird durch eine XOR-Verknüpfung berechnet. Durch dieses berechnete Byte kann beim Ausfall einer Platte die fehlenden Daten wieder errechnet werden.

Durch Verteilung der Paritybytes auf alle Festplatten erfolgt die Wiederherstellung mit höherer Geschwindigkeit. Nichts desto trotz benötigt man beim Speichern und Wiederherstellen Zeit zum Berechnen dieses Bytes.

Berechnung des Paritybytes - XOR

Die logische XOR-Verknüpfung ist immer dann eins, wenn zwei Eingänge unterschiedlich sind (s. Tab. 1). Verknüpft man mehrere Eingänge miteinander gilt somit: Die Summe aller Bits muß gerade sein.

Für ein RAID 5 System mit 3+1 Festplatten gilt dann bspw.:

Für ein RAID 5 System mit 4+1 Festplatten gilt dann bspw.:

➕ Die Daten sind durch das Paritybyte beim einem Festplattenausfall gesichert
➕ Für die Redundanz werden nicht Platten im Verhältnis 1:1, sondern lediglich 2:1, 3:1 oder 4:1 benötigt.
➖ Beim Ausfall einer Festplatte muss diese Platte erst wieder hergestellt werden, bevor das System wieder einsatzbereit ist.
➖ Die Berechnung des Paritybytes benötigt zusätzliche Zeit beim Speichern.

Bit 0 Bit 1 XOR
0 0 0
0 1 1
1 0 1
1 1 0
Tab. 1 Die logische XOR-Verknüpfung ist immer dann eins, wenn zwei Eingänge unterschiedlich sind.

RAID 10 - erhöhte Zugriffsrate und Redundanz




Abb. 4: RAID 10 mit vier Festplatten. Die Daten werden gespiegelt und verteilt gespeichert.

RAID 10 - mirroring and striping

Die Daten werden zuerst auf eine Festplatte gespiegelt (redundant gespeichert) und anschließend jeweils über zwei Festplatten verteilt (s. Abb. 4). Durch die Spiegelung hat man die Datensicherheit von RAID 1 ohne die Parityberechnung von RAID 5 und durch das Verteilen die niedrige Zugriffszeit von RAID 0.

➕ Die Durchsatzrate ist erhöht: paralleler Zugriff ohne Parityberechnung.
➕ Die Datensicherheit ist erhöht.
➖ Die Kapazitätsausnutzung beträgt nur 50 %

RAID im Vergleich

Nicht jedes RAID-System ist für jede Anwendung geeignet. Eine Bewertung wird in Tab. 2 vorgenommen.

Merkmal RAID 0 RAID 1 RAID 5 RAID 10
Min­dest­anzahl Lauf­werke 2 2 3 4
Zugriffs­zeit ➕➕
Daten­sicher­heit keine 1 Platte 1 Platte 1 Platte pro Array
Kapa­zitäts­aus­nutzung € 100 % €€€ 50 % €€ 66,7 % - 94 % €€€ 50 %
Tab. 2: Vergleich der unterschiedlichen RAID-Arten nach Merkmalen: Zugriffszeit, Datensicherheit und Kapazitätsausnutzung.

Aufgabe 1

Das Systemhaus ITsolution muss einem Kunden ein Backupsystem anbieten. Dem Kunden sind eine hohe Ausfallsicherheit und möglichst geringe Anschaffungskosten wichtig.

  1. Wähle ein passendes RAID-System und begründe die Auswahl mit zwei Argumenten.

Der Kunde entscheidet sich für ein RAID 5-System mit insgesamt 5 Festplatten.

  1. Bestimme die Kapazitätsausnutzung.
  2. Bestimme die notwendige Anzahl an Festplatten bei einer Kapazitätsausnutzung von 87,5 %.

Der Kunde hat einen Speicherbedarf von 100 TB.

  1. Berechne die Festplattengröße und die Gesamtspeichergröße bei einem RAID 5-System mit insgesamt 5 Festplatten.
  2. Berechne die Festplattengröße und die Gesamtspeichergröße bei einem RAID 1-System.
  3. Ein vorhandenes NAS besitzt 6 SAS-Festplatten mit je 10 TB Speicherkapazität und an dem RAID-Controller können Sie RAID 10 und RAID 5 einstellen. Berechne die verfügbare Speicherkapazität der beiden RAID-Lösungen.

  1. hohe Ausfallsicherheit: RAID 1, RAID 5 und RAID 10
    geringste Kosten: RAID 5
  2. 4/5 = 80 %
  3. 87,5 % = 7/8 -> 8 Platten
  4. RAID 5 Speicherbedarf: 100 TB
    Speichergröße je Festplatte: 100/4 = 25 TB
    Gesamtspeichergröße: 5⋅25 TB = 125 TB
  5. RAID 1 Speicherbedarf: 100 TB
    Speichergröße je Festplatte: 100 TB
    Gesamtspeichergröße: 2⋅100 TB = 200 TB
  6. RAID 10: 0,5⋅6⋅10 TB = 30 TB
    RAID 5: 5/6⋅6⋅10 TB = 50 TB

Aufgabe 2 Welche Aussage ist wahr?

Wähle die korrekten Aussagen aus.

Ein RAID 5 hat folgende Werte gespeichert:

Bestimme die fehlenden Paritybits.

  1. 00
  2. 01
  3. 10
  4. 11


Ein RAID 5 hat folgende Werte gespeichert:

Bestimme die fehlenden Paritybits.

  1. 00
  2. 01
  3. 10
  4. 11



Ein RAID 5 hat folgende Werte gespeichert:

Bestimme die fehlenden Paritybits.

  1. 1000
  2. 0101
  3. 0001
  4. 1111


Die 3. Festplatte eines RAID 5 fällt aus:

Stelle die Bits wieder her.

  1. 0000 1110
  2. 0101 1010
  3. 0101 1110
  4. 1111 0001


Ordnen Sie die verschiedenen RAID-Systeme nach Datensicherheit.
Wähle eine Antwort.

  1. RAID 5, RAID 10, RAID 0/1.
  2. RAID 10, RAID 0, RAID 5/1.
  3. RAID 1, RAID 5/0, RAID 10.
  4. RAID 10, RAID 5/1, RAID 0.


Bestimme die Kapazitätsausnutzung eines RAID 0 und eines RAID 5 mit 4 Laufwerken.
Wähle eine Antwort.

  1. 50 % und 66,7 %
  2. 100 % und 75 %
  3. 75 % und 75 %
  4. 100 % und 80 %

Aufgabe 3 RAID Vergleich

Ergänze folgende Tabelle.

Parameter RAID 0 RAID 1 RAID 5
Schreib­geschwin­dig­keit
Lese­geschwin­dig­keit
Aus­fall­sicher­keit
Aus­fall­wahr­scheinlich­keit
Invest

Englische und deutsche Wörter

storage Speichersystem
DAS direct attached storage
NAS network attached storage
SAN storage area network
RAID redundant array of independent disks
striping verteilen von Daten auf mehrere Festplatten
mirroring spiegeln von Daten auf eine weitere Festplatte
parity bit berechneter Wert zur Widerherstellung fehlender Daten