Como funciona raid 5

Calculadora RAID

RAID es una tecnología que se utiliza para aumentar el rendimiento y/o la fiabilidad del almacenamiento de datos. La abreviatura significa Redundant Array of Independent Drives o Redundant Array of Inexpensive Disks, que es más antigua y menos utilizada. Un sistema RAID está formado por dos o más unidades que trabajan en paralelo. Pueden ser discos duros, pero hay una tendencia a utilizar también la tecnología para SSD (Solid State Drives). Existen diferentes niveles de RAID, cada uno optimizado para una situación específica. Estos no están estandarizados por un grupo industrial o un comité de estandarización. Esto explica por qué las empresas a veces inventan sus propios números e implementaciones únicas. Este artículo cubre los siguientes niveles RAID:

El software para realizar la función RAID y controlar las unidades puede estar ubicado en una tarjeta controladora separada (un controlador RAID de hardware) o puede ser simplemente un controlador. Algunas versiones de Windows, como Windows Server 2012, así como Mac OS X, incluyen la funcionalidad RAID por software. Las controladoras RAID por hardware cuestan más que el software puro, pero también ofrecen un mejor rendimiento, especialmente con RAID 5 y 6.

Paridad Raid 5

El RAID 5, también conocido como “paridad”, es un método de detección de errores utilizado para detectar y corregir errores en las transmisiones de datos mediante la realización de comprobaciones específicas de los bloques de datos dentro de una franja. En caso de fallo de una sola unidad, la información de la unidad o soporte que falta puede volver a crearse examinando los datos restantes y la información de paridad. Esta información permite al sistema regenerar los bits de datos que faltan.

El RAID 5 incorpora la separación de datos. En una matriz RAID 5 que utiliza tres o más unidades, los datos y la paridad se dividen en todas las unidades. Los datos se procesan en dos unidades, mientras que la tercera contiene la información de paridad. Si se pierde una de las unidades de datos, la información de paridad garantiza que los datos perdidos puedan volver a crearse.

El RAID 5 combina un buen rendimiento, tolerancia a fallos, alta capacidad y eficiencia de almacenamiento. Debido a la necesidad de que el sistema calcule la información de paridad durante la actividad de escritura, el RAID 5 es más adecuado para situaciones en las que la actividad de lectura es mucho mayor que la de escritura. (Para situaciones en las que la actividad de escritura es alta, RAID 1 es probablemente una mejor opción).

Raid 5 cuánto espacio se pierde

De mente simple como soy, pensaría que necesitas 4TB para almacenar tus cosas, y usar los 2TB restantes para la recuperación. ¿Pero cómo puedo recuperar 4TB de sólo 2TB? Si se ha perdido 1kb, sólo tengo 0,5kb para recuperar. Y si eso es suficiente, por qué no utilizar 0,5kb para el almacenamiento desde el principio.

Para el ejemplo, tenemos 3 discos. Un disco contiene la información de paridad, los otros dos los datos (por lo que se pierde 1 disco de espacio para la paridad). Ahora, para cada bit se calcula la paridad, de forma que todos los discos contengan siempre un número par de bits en la misma posición. (Este ejemplo es la teoría básica, la implementación puede diferir ligeramente):

Si usted pierde un disco y tiene ahora (para esta posición en cada disco) la información 1?1 usted sabe, que el ?debe ser 0 porque usted tiene que conseguir un número par de bits. Lo mismo para, por ejemplo, ?00 (==000) o cualquier otra combinación, también con más partes de datos (funciona igual también para 20 discos de datos y 1 de paridad). También mientras pierda sólo un disco (un bit por grupo de paridad), está bien.

Raid 5 vs raid 10

Hay muchas fuentes en la web sobre el principio general del RAID 5, así que no vamos a cubrir esa parte aquí. En resumen, y como ya sabrás, el nivel 5 de RAID funciona con cualquier número de discos igual o superior a 3 y coloca una suma de paridad en uno de los discos del conjunto para poder recuperarse de un fallo de disco. (Bloques rayados con paridad distribuida.) Podemos, por ejemplo, combinar ocho discos físicos en un conjunto RAID 5 consumiendo sólo el tamaño de un disco para la información de paridad. Si un solo disco se estropea, seguiremos teniendo acceso completo a los datos que había en el disco destruido.

Para entender cómo es posible esto, tenemos que fijarnos en la unidad más pequeña, el bit binario, que puede ser 1 o 0. Al hacer cálculos matemáticos en binario tenemos varias operaciones llamadas de álgebra booleana, por ejemplo la operación AND y la operación OR.

Una de estas operaciones lógicas de bajo nivel se utiliza mucho en RAID5: el XOR (“or exclusivo”). XOR toma dos dígitos binarios y produce un resultado verdadero si exactamente un dígito es verdadero, (es decir, el otro dígito tiene que ser falso).