Quel RAID pour protéger efficacement ses données ?

Vous envisagez l’achat d’un NAS ou d’un RAID pour y stocker des données importantes ? Nous allons vous présenter les différents avantages et inconvénients de chaque configuration, du raid0 au raid 5 en passant par le raid1 et le raid6 méconnus à tort.

Pour monter un système RAID vous trouverez de nombreux tutoriels sur le net. Voici les configurations RAID les plus répandues, il en existe encore bien davantage :

  • RAID 0 : appelé etendu 
  • RAID 1 : appelé mirroringshadowing ou duplexing
  • RAID 2 : appelé striping with parity (obsolète)
  • RAID 3 : appelé disk array with bit-interleaved data
  • RAID 4 : appelé disk array with block-interleaved data
  • RAID 5 : appelé disk array with block-interleaved distributed parity
  • RAID 6 : appelé disk array with block-interleaved distributed parity

RAID 0 ou RAID « stripping » : la performance sans filet de sécurité.

En mode RAID 0, tous vos disques durs sont combinés en un seul et même disque, les données sont ainsi réparties entre tous les disques . Si le RAID 0 s’avère plus rapide il a l’inconvénient d’être plus fragile, en effet si l’un des disques tombe en panne c’est tout le RAID qui tombe en panne. C’est à dire que vous ne pourrez pas lire les données qui se trouvent sur les autres disques fonctionnels. En résumé, plus de performances, mais plus fragile.

En RAID 0, la capacité totale disponible est également à la somme des capacités des disques durs physiques, à la condition que ceux-ci aient tous la même taille. En cas de différence, c’est la capacité du disque le plus petit qui est prise en compte, multipliée par le nombre de disques ; les autres ne seront donc que partiellement utilisés. Le raid0 offre les meilleurs performances mais une sécurité inexistante. Les données sont stockées sur l’ensemble des disques.

Le conseil de l’Expert en récupération de données : ne pas utiliser plus de deux disques en RAID0. Nous avons déjà vu un RAID0 monté avec 48 disques de 4To chacun (une société de production vidéo). Des performances record en écriture/lecture.. mais une fiabilité épouvantable ! Imaginez… Si un seul disque des 48 tombe en panne et n’est pas récupérable (panne mécanique avec plateaux rayés par la tête de lecture), toutes les données sont corrompues ! Et même si ce 48ème disque est récupéré en salle blanche, la facture finale sera presque 24 fois le montant d’une récupération de données pour un RAID0 en 2 disques.

Le RAID0 n’est donc pas une solution valable pour sécuriser vos données. On l’adoptera uniquement pour des traitements de calculs lourds (statistiques, logiciel SAS, traitement vidéo post-production, imagerie 3D…) et pour des données temporaires non vitales.

RAID1 ou RAID « miroir » : le dédoublement de personnalité.

Le mode RAID 1 (« mirroring ») représente le moyen d’obtenir un stockage redondant et donc d’augmenter la durée de vie de vos données en cas de défaillance du disque. Dans une grappe RAID 1 composée de deux disques, les données sont écrites sur un et immédiatement copiées sur l’autre ; les disques contiennent donc les mêmes données, c’est pour cela qu’on appelle le RAID 1 « miroir ».

Lorsqu’un disque dur est défectueux, les données restent accessibles via les autres disques. Ainsi, plus il y a  de disques, plus grande est la sécurité de vos données.

Le RAID 1 a également un autre avantage : si le NAS lui-même tombe en panne, il est possible de retirer les disques durs de l’appareil et de les brancher directement sur un ordinateur, ce qui n’est pas envisageable avec les disques constituant une grappe RAID 0, RAID 5 ou RAID 6 dont les données sont entrelacées et réparties sur les disques. En générale, les grappes RAID 1 contiennent deux disques ; leur capacité totale équivaut à celle du plus petit.

Exemple : si vous combinez deux disques de 2 To, la capacité totale atteint 2 To, soit la moitié de la capacité achetée. Par contre, si vous combinez un disque de 500 Go et un 2 To en RAID 1, la capacité totale de la grappe n’est que de 500 Go. Autant dire qu’il est essentiel d’éviter les grosses disparités.

Orienté sécurité, le RAID 1 duplique automatiquement l’ensemble de vos données sur deux (ou plus) disques durs. Ainsi lorsqu’un disque tombe en panne les données restent accessibles via les autre disques fonctionnels. Il suffira alors de remplacer le disque défectueux par un disque sain pour que les données soient à nouveau dupliquées. Ce système n’apporte pas de gain de performances et se fait au détriment de la capacité. En effet, avec un système de deux disques de 300 Go en RAID 1, seuls 300 Go pourront être utilisés par l’utilisateur (les 300 Go restants sont utilisés pour la duplication des données).

Le conseil de l’Expert en récupération de données : il arrive parfois que la carte controlleur du RAID1 soit en court circuit. Comme les deux disques du RAID 1 sont branchés sur la même carte contrôleur, la surcharge électrique peut endommager les deux disques en même temps ! Pour palier cela pensez à brancher chaque disque dur avec un cordon d’alimentation différent sur le un bloc d’alimentation de l’ordinateur. Prenez un modèle modulaire de type Corsair HX850i  qui gère de manière distincte chaque approvisionnement électrique 12V. C’est plus cher… mais beaucoup plus fiable.

RAID 10 :  la performance d’un RAID0 et la sécurité d’un RAID1

Pour comprendre la configuration du RAID 10, il faut avant tout détailler les RAID 1 et RAID 0 qui la composent. En premier lieu, le RAID 1 est un ensemble de deux disques durs, dont l’un est utilisé en miroir afin de sécuriser les données stockées. Ce système de clonage présente une haute tolérance aux pannes et convient donc au stockage des données sensibles. Le RAID 0 est un système qui permet de répartir les informations stockées sur plusieurs disques durs grâce à un entrelacement des données. Le temps d’accès est alors accéléré.

Le RAID 10, également appelé RAID 1+0 consiste à assembler deux ou plusieurs unités RAID 1 en un ensemble RAID 0. En clair, deux disques durs sont assemblés en RAID 1, deux autres disques durs sont assemblés de manière identique et ainsi de suite. Il faut donc un minimum de quatre disques et toujours en nombre pair. Une grappe ainsi assemblée forme ainsi une unité logique qui sera associée avec d’autres grappes pour permettre un entrelacement comme c’est le cas d’un système RAID 0. La redondance des données dans chaque sous-unité permet de garantir leur sécurité, tandis que la répartition des données sur plusieurs unités logiques accélère la lecture et l’écriture. Il y a l’inverse qui est appelé RAID 01, la tolérance aux pannes est moins importante, étant donné qu’un sous-ensemble RAID 0 défaillant impacte sur l’ensemble de la performance.

Le conseil de l’Expert en récupération de données : le raid 10 et 01 est très peu utilisé et pour sûr ! 2 disques sont sacrifiés au prix de la fiabilité. Sur un total de 4 disques vous n’exploitez que la taille mémoire de deux disques.

RAID5 : la solution la plus utilisée… à tort ?

Le RAID 5 est la moins performante des 3 solutions mais apporte l’un des plus hauts niveaux de sécurité. Les données sont copiées sur l’ensemble des disques et, en cas de panne de l’un des disques, les disques restants peuvent continuer de fonctionner normalement ou presque (en mode « dégradé »). Si vous changez le disque dur en panne, le RAID5 est capable de se reconstruire en incluant ce nouveau disque dur. La reconstruction des données peut durer de nombreuses heures voir plusieurs jours, pendant ce temps les performances d’écriture/lecture sont fortement dégradées.

Le RAID 5 utilise au moins trois disques durs et répartit les données sur plusieurs disques durs pour gagner en performance grâce à l’accès simultané, mais à la différence du RAID 0, le RAID 5 inclut des codes de correction (les bits de parité) entre les données.

L’inconvénient c’est donc que vous perdez la capacité d’un disque dur sur l’ensemble du RAID. Pour 5 disques durs en RAID5 la capacité totale de stockage est donc abaissée à celle de 4 disques seulement. On dit que le 5ème disque est un disque utilisé pour la parité mais c’est un abus de langage, le 5ème disque est utilisé comme les autres mais la parité est répartie sur tous les disques successivement de sorte que la taille totale des données de parité correspond à la capacité d’un disque dur.

Le RAID 5 est donc bien plus sûr que le RAID 0, mais offre beaucoup moins de performances d’écriture/lecture. Ces performance sont tout de même supérieures à celle d’un disque dur seul non RAID. Et plus vous rajoutez de disques dans le RAID5, plus vous accélérez les performances.

Le conseil de l’Expert en récupération de données : en théorie et dans la pratique, si un disque dur est en panne on peut l’enlever à chaud (donc sans éteindre l’ordinateur) et le remplacer par un nouveau disque dur. Attention, si ce disque contenait des données elles seront toutes écrasées. Dans la pratique ce n’est pas toujours comme cela que la reconstruction se passe et toute la grappe RAID peut s’en voir corrompue. Nous vous suggérons donc de faire une sauvegarde de vos données sur un autre disque ou RAID avant de changer (à froid ou à chaud) un disque. Le RAID5 ne tolère que la panne d’un seul disque pour continuer à fonctionner. Et nous savons, en qualité d’experts en récupération de données RAID qu’il arrive trop souvent qu’un deuxième disque tombe en panne avant que l’informaticien ne s’en aperçoive. C’est pourquoi toutes les entreprises devraient utiliser un RAID6 qui tolère la panne de DEUX disques durs simultanément.

RAID6 : Fiabilité & performance !

Si votre carte RAID sait créer un RAID6 alors c’est cette configuration que vous devriez adopter ! Le RAID6 utilise les mêmes caractéristiques en terme de performances que le RAID5 mais au lieu d’avoir une tolérance de panne d’un seul disque il peut fonctionner même si DEUX disques durs tombent en panne. Le RAID6 utilise la technologie de la double parité de données ce qui lui fait perdre la capacité de deux disques durs. Si vous avez un RAID6 en 8 disques, la capacité de stockage en sera réduite à celle de 6 disques durs. Il faut 4 disques au minimum pour configurer une grappe RAID de niveau 6.

Le conseil de l’Expert en récupération de données : en adoptant le RAID6 vous ne devriez jamais avoir besoin de Chronodisk pour récupérer vos données perdues. A moins que vous ne soyez excessivement négligeant et que vous attendiez que 3 disques durs tombent en panne avant de réagir. Sachez qu’en cas de panne, le prix de la récupération de données ne dépend pas du type de RAID utilisé mais du nombre de disques utilisés dans le RAID ainsi que de la gravité de la panne de chaque disque (panne logique/désynchronisation de la grappe, panne mécanique, plateaux abîmés par des secteurs morts, etc.). Au delà de 4 disques le prix ne croit plus autant avec le nombre de disques. Le diagnostic et l’estimé sont sans frais jusqu’à quatre disques dans notre laboratoire mais pour les grappes RAID de 5 disques et plus le diagnostic-devis est chargé 90$+tx par disque. Ce diagnostic est toujours garanti en moins de 5 heures, ce qui reste assez unique au Canada et ailleurs dans le monde.

Quelques statistiques du département RAID de Chronodisk : 

Pour les centaines de RAID 5 que nous avons eu à résoudre ces 12 dernières années au Québec et en France, les quelques rares cas dans lesquels la récupération de données s’est avérée impossible c’est dans 90% des cas en raison des manipulations de l’utilisateur qui, en cherchant à résoudre par lui-même le problème, a aggravé les symptômes. Les données ont de ce fait été écrasées ou désynchronisées de manière irrémédiable. Dans 10% des situations c’est en raison d’un disque dur de trop qui est tombé en panne mécanique lourde, les plateaux étaient trop abîmés pour pouvoir réaliser un clone et reconstruire la grappe RAID (cas d’incendie notamment).

Astuces Disque dur Données Récupération de données Sécurité