Home
 
Download
 
Buy now
 
Tech support
     
Tools
Instructions
Plus d'information
Screenshots
ZAR 8.4 Manual
Zmeil 2.1 Manual
Zlon 1.0 Manual
Liste des appareils photo numériques compatibles
Checklists
Articles
Links
Test sur le thème restauration de données
Vocabulaire de termes
News
Contacts

Page maître / Plus d'information / Articles / RAID 101

RAID 101

les notions générales

RAID est l’abbréviation de "Redundant Array of Inexpensive (or Indépendent) Disks" (matrice redondante de disques bons marchés (ou indépendents)), ce qui est originellement opposé au SLED (seul disque bon marché de grande capacité). Dans un RAID, les données sont réparties sur quelques disques physiques (connus sous le nom "Constituants") pour assurer une fiabilité additionelle et l’augmentation de la vitesse. Il y a quelques "niveaux RAID" qui différent par des algoritmes du positionnement de données (voir ci-dessous). Le système opérationnel diagnostique la matrice des disques comme un seul disque de grande capacité, et à l’égard de vue de la conservation des fichiers (et les unités du système de fichiers en général) pour que les opérations avec la matrice RAID ne soient pas différents des celles sur un appareil régulier à l’égard de la mémoire de fichiers (et les enchaînements du système de fichiers en général).

Le RAID est implanté soit par l’enchaînement (ce qui est nommé "logiciels RAID") ou bien par le contrôleur spécial d’instrumentation ("hardware RAID"). Et Microsoft Windows NT et la plupart des variations de l’Unix/Linux offrent leurs implications logicielles du RAID. Les systèmes opérationnels Microsoft Windows 9x n’ont pas d’enchaînements logiciels RAID, mais quand même peuvent être utilisés avec des contrôleurs d’instrumentation RAID (à cause de la transparence de contrôleur).

 

RAID does not provide perfect reliability

Faites attention à une idée suivante: le RAID, sans prendre en considération sa redondance, ne substitute pas la sauvegarde régulière.

Considérez des points suivants:

  • Les défaillances multiples de disques se passent, surtout si elles sont causées par la source unique (par exemple le bloc d’alimentation se casse et rejette 220 volt de courant alternatif sur le bus de 5V DC – cela met tous les unités alimentés de ce bloc hors de service).
  • Toute la matrice peut être perdue à cause de la défaillance de contrôleur.
  • Le virus peut éliminer les données de la matrice. La matrice sera encore fonctionnelle à l’égard de son instrumentation, mais les données seront inutiles.
  • Le feu ou bien les catastrophes naturelles (telles comme inondation) peuvent détruire toute la matrice.
  • L’erreur d’operateur peut endommager les données ou la reconfiguration de RAID.

 

JBOD (Le tas de disques), également connu comme "Span"/"Spanned Volume".

Ce n’est pas un RAID dans le sense stricte, parce que le JBOD n’assure aucune redondance. Si un des disques dans la matrice de type JBOD tombe en panne, toute la matrice se casse et on perd toutes les données. L’usage typique du layout JBOD est tout simplement de créer un disque d’une capacité plus grande par la concatenation de deux (ou bien plus) petits disques. Ce n’est pratique que pour les disques de capacité différente. Pour les disques de capacité identique le RAID 0 est mieux parce qu’il assure la même augmentation de capacité avec l’augmentation de lecture/écriture dans des applications ordinaires. Le JBOD peut assurer l’augmentation de vitesse si deux opérations demandent simultanément les blocs de données qui sont conservées sur les disques différents, mais c’est une situation relativement rare (disons par example que pour des blocs D1, D2, D3 et D11, D12 la lecture est demandée simultanément; dans ce cas deux operations peuvent être executées parallélement augmentant la vitesse générale de lecture).

Le minimum de deux disques est demandé pour l’instrumentation JBOD. Le minimum d’un disque est demandé pour le logiciel JBOD (Windows NT "Spanned volume"). Avec JBOD, il n’y a pas de perte dans l’espace de disque. Une exception suivante peut ou ne peut pas être appliqué dans votre cas: le contrôleur d’instrumentation RAID peut supporter une configuration monodisque JBOD – ce n’est qu’un truc pour permettre un monodisque d’être attaché au contrôleur, sans rien RAIDer. La même chose peut être appliquée au RAID0 contenant un constituant.

JBOD (Spanned volume) layout

 

RAID 0, également connu sous le nom d'«entrelacement de disques»

C’est aussi un RAID “sans redondance” qui tombe en panne si aucun constituant de la matrice tombe en panne. Le grand mérite du RAID 0 est qu’il assure l’augmentation de vitesse N fois pour la configuration de disque N. Les demandes de lecture/écriture sont distribuées régulièrement dans les membres disques, ainsi elles peuvent être executées parallélement. Par exemple, si l’écriture des blocs de données D1 … D6 est demandée, les blocs impairs (D1, D3, D5) doivent être écrits au Disque 1 et les blocs pairs (D2, D4, D6) doivent être écrits au Disque 2, qui double la vitesse totale d’opération.

Le minimum de deux disques est demandé pour un volume RAID 0. Il n’y a pas d’espace de disque associé avec le volume RAID 0. Une exception suivante peut ou ne peut pas être appliquée à votre cas: le contrôleur d’instrumentation RAID peut supporter une configuration monodisque RAID0 – ce n’est qu’un truc pour permettre un monodisque d’être attaché au contrôleur, sans rien RAIDer. La meme chose s’applique au JBOD qui contient un constituant.

RAID0 (Stripe set) layout

 

RAID 1: miroitage de disques.

Dans un volume miroir, deux copies exactes de données sont écrites sur deux constituants. Ainsi le disque "d’ombre" est une copie exacte de son disque "primaire". Ce layout peut tolérer la perte de quelque monodisque (les demandes d’écriture seront satisfaites avec le disque fonctionnel). Le volume miroir assure la vitesse de lecture deux fois plus grande d’un monodisque: quand il est nécessaire de lire les blocs de 1 à 6, les blocs impairs (D1, D3, D5) seront lus en commencant par le Disque 1, et les blocs pairs (D2, D4, D6) – par le Disque 2. De cette façon chaque disque fait la moitié du travail. La vitesse d’écriture n’augmente pas parce qu’il faut écrire toutes les copies de données sur deux disques.

C’est possible d’avoir plus de deux disques dans la série de miroir (par example, la configuration de trois disques - "primaire" avec deux “d’ombre”), mais ces matrices ne sont prseque pas utilisées à cause des grandes pertes d’espace de disque (66% dans la configuration de trois disques).

Deux disques sont nécessaires pour le volume RAID 1. Le layout du RAID 1 impose 50% de la perte de capacité des disques.

RAID 1 (Mirror) layout

 

RAID 5: volume agrégé par bandes à parité répartie.

RAID 5 utilise une function de parité pour assurer la redondance et la reconstruction de données. Typiquement, une fonction binaire exclusive OR (XOR) est utilisée pour calculer la parité de la "ligne" de la matrice. En tout cas, la parité est calculée comme une fonction de quelques blocs de données P=P(D1, D2, ... DN-1) pour le layout de disque N. Dans le cas de la défaillance d’un monodisque, la fonction inverse est utilisée pour calculer les blocs de données restants et les blocs de parité.

Disons par exemple que le Disque 3 tombe en panne dans la configuration illustrée ci-dessous.

  • Les blocs de données D1 et D2 seront lus directement de leurs disques correspondants (qui sont opérationnels).
  • Le bloc de parité P1,2 n’est pas vraiment nécessaire (ne contient pas les données d’utilisateur) ainsi il sera repoussé.
  • Le bloc de données D3 sera lu de son disque correspondant (Disque 2).
  • Le bloc de données D4 absent sera reconstruit à l’aide de D3 et P3,4 d’une manière suivante: D4=Pinverse(D3,P3,4)

Pendant l’opération normale, la vitesse de lecture augmente (N-1) fois, parce que les demandes seront distribuées régulièrement entre les diques N-1 (la lecture des blocs de parité pendant des opérations normales n’est pas nécessaire). Le processus d’écriture est plus compliqué, et exige plus de temps. Par exemple nous avons besoin d’écrire un bloc D1. Il est aussi nécessaire d’actualiser son bloc de parité correspondant P1,2. Il y a deux moyens pour le faire:

  1. Lire D2; calculer P1,2=P(D1,D2); écrire D1 et P1,2;
  2. Lire D1;old et P1,2;old; calculer P1,2 de ces données; écrire D1 et P1,2.

Tous les deux moyens exigent le minimum d’une opération de lecture. Cette opération ne peut pas être executée simultanément avec l’opération correspondante d’écriture, ainsi la vitesse d’écriture va diminuer (deux fois plus petite si on admet que les vitesses de lecture et d’écriture sont égales). La plupart d’implementations actuelles mitigent cet effet par gardant toute la "ligne" (D1, D2 et D3) dans l’antémémoire.

Le minimum de trois disques est demandé pour implementer le RAID5. La perte de l’espace de mémoire ne dépend pas du nombre des disques et est égal à la capacité d’un constituant.

RAID 5 (Stripe set with parity) layout

 

RAID 0+1: basé sur des grappes en stripping.

Il permet de combiner les performances de vitesse du RAID 0 (grappe en stripping) avec la tolérance aux pannes du RAID 1 (miroir). Son seul inconvénient est la perte du 50% de l’espace de disque.

Pour la configuration du N-disque (avec deux grappes en stripping avec N/2 disque chacune)

  • La vitesse en lecture est accrue N fois par comparaison avec celle d’un constituant (la demande de lire les blocs de D1 à DN sera répartie spécialement pour permettre chaque constituant de lire un bloc).
  • Le vitesse en écriture accrue N/2 fois par comparaison avec celle d’un constituant (la demande d’écrire les blocs de D1 à D4 sera répartie d’une manière quelle permettra les Disques 1 et 3 d’écrire les blocs D1 et D3 et les Disques 2 et 4 d’écrire les blocs D2 et D4, ainsi doublant la vitesse en écriture dans quatre unités de stockage).

La matrice du RAID 0+1 peut offrir la tolérance aux pannes d’un seul disque. Ajoutez à cela qu’il peut traiter la moitié des défaillances duales dans la configuration de quatre disques (par example si les disques 1 et 2 tombent en panne dans la configuration illustrée ci-dessous, la matrice serait encore fonctionnelle bien que réduite à une grappe en stripping).

Le minimum de quatre disques est demandé pour le volume de RAID 0+1, avec la perte de 50% de l’espace de disque.

RAID 0+1 (Mirrored stripe set) layout

 

Other (exotic) RAID layouts

Il y a quelques autres (exotiques) types de matrices RAID, mais ils sont rarement utilisés, et leur description n’est pas stipulée dans cet article.

  • RAID 3 and RAID 4 are similar to RAID 5 but use dedicated disk to store parity information. This disk becomes a bottleneck during write.

  • RAID 6 is similar to the RAID 5 but uses two different parity functions to maintain redundancy. RAID6 can tolerate a dual failure (simultaneous loss of two drives). RAID6 is useful in high-capacity systems when the rebuild of a RAID5 would take a long time and there is a significant probability that another drive will fail before the rebuild is done, thus causing a loss of the array.

 

Enfichage à chaud et/ou miroitage

Quelques implémentations tolérantes aux pannes permettent les disques additionnels de se référer aux disques "enfichés à chaud". Une fois que le disque d’une matrice tombe en panne, on utilise le disque "enfiché à chaud" pour reconstruire la matrice et récupérer la redondance le plus vite possible, permettant de retarder l’opération de maintetnance (remplacement à chaud des unités de stockage). Mais il y a un truc qu’il faut savoir. Le contrôleur doit effectuer la vérification périodique d’une unité "enfichée à chaud". Si le disque "encfiché à chaud" contient des secteurs en panne et reste inaperçu ce disque sera inutile quand un des disques de la matrice tombe en panne. Si le disque "enfiché à chaud" tombe complètement en panne on va le diagnostiquer au moment où le contrôleur détecte qu’il n’y a pas de réponse du disque. Ainsi il n’est pas possible de détecter les secteurs en panne. Ils restent inaperçus jusqu’il est trop tard.

C’est la même chose avec le RAID 1. Le contrôleur doit alterner les demandes en lecture pour des disques différents de telle façon que chaque disque effectue une partie égale des lectures. Dans ce cas si les secteurs en panne sur un des disques seront détectés plus vite (parfois on l’appelle une implémentation tolérante aux pannes "active/active"). Si on utilise un schéma "actif/sauvegarde", il n’est possible qu’effectuer la lecture du disque primaire et au cas de sa défaillance diriger les demandes au disque d’ombre. Dans ce cas le disque d’ombre peut contenir des secteurs en panne inaperçus et si le dsique tombe en panne, la sauvegarde sera défectueuse.

 

Diagnostique de la capacité RAID, de la vitesse en accès et de la tolérance aux pannes.

Le planning du RAID peut être effectué à l’aide d’intervention manuelle (voir la table ci-dessous). Nous avons aussi créé le online RAID calculateur qui peut estimer les performances d’une matrice et des constituants.

 

La table des types des systèmes RAID

Type de RAID

Nombre de disques nécessaires

Tolérance aux pannes

Augmentation en vitesse avec N disques dans la matrice*

Perte de données**

JBOD (Span)

2+

Nulle

Incertaine (dépend du layout). Insignifiante augmentation pour des applications typiques

Nulle

RAID 0 (Agrégé par bandes)

2+

Nulle

Augmentation de vitesse en lecture/écriture N fois

Nulle

RAID 1 (Miroitage)

Exactement 2

Défaillance d’un seul disque

Double augmentation de vitesse en lecture;

la vitesse en écriture restant invariable

100%

RAID 5 (agrégé par bandes à parité répartie)

3+

Défaillance d’un seul disque (ce qui mene à la baisse de vitesse en lecture)

La vitesse en lecture augmente (N-1) fois;
la vitesse en écriture baisse 50% dans de cas graves

Une capacité equivalente à celle d’unconstituant (utilisé pour la conservation de la somme de contrôle)

RAID 0+1 (grappes en stripping)

4+

Défaillance d’un seul disque; la moitié des defaillances de doubles disques, ce qui dépend du positionnement/de la destination des disques en panne

La vitesse en lecture augmente N fois;
la vitesse en écriture augmente N/2 fois

100%

*Faites attention: l’augmentation en vitesse est une valeur assez grossière basée sur la supposition que le flux de données consiste en lecture linéaire des grandes fractions de données. Cette estimation sous-entend aussi que les contrôleurs supportent une exécution simultanée des demandes et qu’il n’y a pas de problèmes avec le débit de bus (parce que quelques contrôleurs RAID aux meilleurs performances peuvent excéder le bus de type PCI).

**Faites attention: la perte de données est fondée sur la supposition que tous les constituants ont la capacité égale. Si la taille différe d’un constituant à l’autre, la plus petite sera utilisée comme la taille de "colonne".

<<Partition recoveryArticlesRAID5 implementations>>

Special offers

Weekend discount
starts in 5 hours 17 min

Our customers say

I just can't believe it. 2 corrupted Zip disks with thousands of images on them recovered in minutes by downloading this software. I just can't believe my eyes, my pictures are saved! I am ohappyone! Simple to use and it really works. It was not able to recover the original names and properties but one zip disk I have had for 5 years hoping to find a program like this to save it for me.


 
Carte du site
Copyright © 2001-2009 ZAR Data Recovery
[Data recovery]

There are currently 102 visitors browsing the site.