【IT用語】RAID5について徹底解説!

IT用語

RAID5とは

RAID5とは、複数のハードディスクを一台のハードディスクに見せて、実データもパリティ(誤り検出用データ)も分別せずハードディスクに保存することで、負荷分散しデータの高速化と冗長性を確立するHDDのデータ保存方法です。

このRaid5について話すにはRaid4の復習をする必要があります。

Raid4はブロック単位でデータを保存する方法なので、byte単位で保存していたときよりも早く保存できる方法でした。
ただ実データとパリティ(誤り検出用データ)は別々のHDDに保存していました。
その別々で保存する事ががデータを保存するスピードを遅らせていたことになります。

例えばレジで考えてみましょう。
5台のレジがあります。
4台が普通のレジ、1台のレジが誤り検出用データだけを記録するレジだとします。

するとこの一台のレジは4台のレジが処理する分だけ、レジのデータが壊れたとき用の誤り検出用データを保存する必要があります。
つまり圧倒的にこの一台のレジにかかる負担は大きいわけですね。

ではRaid5とはどういうモノかというと、専用レジというモノを用意しません。
つまりどのレジもデータの保存も行うし、誤り検出用データも保存するわけです。
これでどの様なことが言えるかというと、全てのレジが均等な忙しさになるわけですね。

例えば8人の人が4台のレジに並んでます。
8人の処理を4台のレジがしているとき、1台の誤り検出用データレジは8人分処理しなければいけません。
めちゃ一つのレジだけ負担がすごいわけです。
なんせ一台で8人分のデータを処理するからです。
ただこれが専用レジを用意しなければどうなるでしょうか。

5台のレジがそれぞれデータの保存も行うし誤り検出用データの保存も行うので、均等な忙しさ + 全員でやるので早い

Raid4、レジの処理は早かったが、誤り検出用データの保存だけ時間がかかった
Raid5、全員でレジの処理もするし、誤り検出用データの保存もするからレジの数だけ早くなる。

Raid4、実データの保存は早かったが、誤り検出用データの保存だけ時間がかかった。
Raid5、実データの保存も誤り検出用データの保存も一緒にやるのでHDDの数だけ処理が早くなる。
Raid4とRaid5には上記の様な違いがあります。

まとめ

Raid5はHDDの数だけ処理が早くります。実データ保存と誤り検出用データ保存を同時にやるという特徴があります。