RAID

Ir a: navegación, búsqueda de
Este artículo está sobre la tecnología de almacenamiento de datos. Para otras aplicaciones, vea RAID (desambiguación).

RAID (matriz redundante de discos independientes) es un dato Virtualización de almacenamiento tecnología que combina múltiples física unidad de disco componentes en una sola unidad lógica para los propósitos de redundancia de datos, mejora del rendimiento, o ambas cosas.[1]

Los datos se distribuyen a través de las unidades de una de varias formas, conocidos como Niveles de RAID, según el nivel requerido de redundancia de y el rendimiento. Los diferentes esquemas o diseños de distribución de datos, son nombrados por la palabra seguida de un número, por ejemplo, RAID 0 o RAID 1 RAID. Cada esquema, o nivel RAID, proporciona un equilibrio diferente entre los objetivos claves: fiabilidad, disponibilidad de, rendimiento, y capacidad. Niveles RAID más de RAID 0 proporcionan protección contra irrecuperable sector leer errores, así como frente a fallos de discos físicos todo.

Contenido

  • 1 Historia
  • 2 Resumen
  • 3 Niveles estándar
  • 4 Anidados (híbrido) RAID
  • 5 Niveles no estándar
  • 6 Implementaciones de
    • 6.1 Basado en software
    • 6.2 Basada en firmware y controladores
  • 7 Integridad
  • 8 Debilidades
    • 8.1 Faltas correlacionadas
    • 8.2 Errores de lectura no recuperable durante la reconstrucción
    • 8.3 Aumentar la probabilidad de tiempo y la falta de reconstrucción
    • 8.4 Atomicidad: incluyendo de inconsistencia de paridad debido a caídas del sistema
    • 8.5 Fiabilidad de la memoria caché de escritura
  • 9 Véase también
  • 10 Referencias
  • 11 Acoplamientos externos

Historia

El concepto subyacente de RAID fue hablado primero de por los socios fundadores de GEAC Computer Corporation, Alemán de Gus y Ted Grunau, quien se refirió a él como MF-100.[2]

El término "RAID" fue inventado por David Patterson, Garth A. Gibson, y Randy Katz en el Universidad de California, Berkeley en 1987. En la de junio de 1988 de papel "A caso para redundante arreglos de discos económicos (RAID)", presentado en el SIGMOD Conferencia, argumentaron que la ejecución superior mainframe unidades de disco de la época podría vencidas en funcionamiento por una serie de las unidades de bajo costo que se habían desarrollado para el crecimiento ordenador personal mercado. Aunque fallas aumentaría en proporción al número de unidades, configuración de redundancia, la fiabilidad de una matriz podría superan con creces la de cualquier gran disco.[3][4]

Aunque aún no usando esa terminología, las tecnologías de los cinco niveles de RAID en el papel de junio de 1988 fueron utilizadas en varios productos antes de la publicación del periódico,[5] incluyendo los siguientes:

  • En 1977, Norman Ken Ouchi en IBM presentó una patente que revele lo que posteriormente fue llamado RAID 4.[6]
  • Alrededor 1983, DEC comenzó a enviar unidades de disco de RA8X subsistema espejada (ahora conocidas como RAID 1) como parte de su subsistema de HSC50.[7]
  • En 1986, Clark et al. en IBM presentó una patente que revele lo que posteriormente fue llamado RAID 5.[8]
  • Alrededor de 1988, el Máquinas de pensamiento DataVault error utiliza códigos de corrección (ahora conocidos como RAID 2) en una matriz de unidades de disco.[9] Un acercamiento similar fue utilizado en la década de 1960 en la IBM 353.[10][11]

Fabricantes de la industria RAID más tarde tienden a interpretar la sigla como "matriz redundante de independiente discos".[12][13][14][15]

Resumen

Muchos niveles RAID emplean un esquema de protección de error denominado"paridad", un método ampliamente usado en tecnología de la información para proporcionar tolerancia a fallos en un determinado conjunto de datos. Uso más sencillo XOR, pero 6 de RAID utiliza dos paridades independientes basadas respectivamente en la adición y la multiplicación en un determinado Campo de Galois o Corrección de errores Reed-Solomon.[16]

RAID puede también proporcionar la seguridad de los datos con unidades de estado sólido (SSD) sin el gasto de un sistema de todos-SSD. Por ejemplo, se puede efectuar copias espejado un SSD rápido con un accionamiento mecánico. Para que esta configuración proporcionar una ventaja significativa de la velocidad un controlador adecuado es necesario que utiliza el SSD rápido para todas las operaciones de lectura. Adaptec llama a este híbrido del"RAID".[17]

Niveles estándar

Artículo principal: Niveles RAID estándar
Servidores de almacenamiento con 24 discos duros y controladoras RAID de hardware incorporado apoyo a varios niveles RAID

Se ha desarrollado una serie de esquemas estándar. Estas son las llamadas niveles de. Originalmente, había cinco niveles RAID, pero han evolucionado muchas variaciones, en particular varios niveles anidados y muchos niveles no estándar (sobre todo propietario). Niveles de RAID y sus formatos de datos asociados están estandarizados por el Storage Networking Industry Association (SNIA) en el estándar de formato de unidad de disco RAID comunes (DDF):[18][19]

RAID 0
RAID 0 consiste en reparto de los, sin espejado o paridad. La capacidad de un RAID 0 volumen es la suma de las capacidades de los discos del conjunto, lo mismo que con un volumen distribuido. No hay ninguna redundancia adicional para el manejo de fallos de disco, así como con un volumen distribuido. Por lo tanto, falta de causas de un disco, la pérdida de todo el volumen RAID 0, con reducidas posibilidades de recuperación de datos en comparación con un volumen distribuido roto. Bandas distribuye el contenido de archivos más o menos igualmente entre todos los discos del conjunto, que hace concurrente lee o escribe las operaciones en los discos múltiples casi inevitables y resulta en mejoras de rendimiento. Hacen las operaciones concurrentes el rendimiento de procesamiento de la mayoría Lee y escribe operaciones iguales a la capacidad de un disco multiplicado por el número de discos. Mayor rendimiento es la gran ventaja de RAID 0 versus volumen distribuido, [13] a costa de mayor vulnerabilidad a fallas de unidades.
RAID 1
RAID 1 se compone de espejado de datos, sin paridad o rayas. Datos se escriben idénticamente en dos unidades, produciendo un "conjunto reflejado" de unidades. Por lo tanto, cualquier solicitud de lectura puede ser reparado por cualquier unidad en el conjunto. Si se emite una solicitud a cada unidad en el conjunto, puede ser reparado por la unidad que tiene acceso a los datos en primer lugar (dependiendo de su tiempo de búsqueda y latencia de rotación), mejorar el rendimiento. Rendimiento sostenido de leer, si el controlador o el software está optimizado para ello, acerca a la suma de los rendimientos de cada unidad en el conjunto, así como para RAID 0. Rendimiento de lectura real de la mayoría de las implementaciones de RAID 1 es más lento que el coche más rápido. Rendimiento de escritura es siempre más lenta porque cada unidad debe ser actualizado, y la unidad más lenta limita el rendimiento de la escritura. La matriz sigue funcionando como funciona al menos un disco. [13]
RAID 2
RAID 2 consiste en bandas de nivel de bit con dedicadas Código Hamming paridad. Rotación de eje de disco todo está sincronizado y datos a rayas tal que cada uno secuencial poco está en una unidad diferente. Código Hamming paridad se calcula a través de bits correspondientes y almacenada en al menos un disco de paridad. [13] Este nivel es de importancia histórica Aunque fue utilizado en algunas máquinas tempranas (por ejemplo, la Máquinas de pensamiento CM-2), [20] a partir de 2014 no se utiliza por cualquier sistema disponible comercialmente. [21]
RAID 3
RAID 3 consta de nivel de byte striping con paridad dedicado. Rotación de eje de disco todo está sincronizado y es a rayas de los datos que cada uno secuencial bytes está en una unidad diferente. La paridad se calcula a través de bytes correspondientes y almacenada en un disco de paridad dedicado. [13] Si bien existen implementaciones, [22] RAID 3 no se utiliza comúnmente en la práctica.
RAID 4
RAID 4 consiste en bandas de nivel de bloque con paridad dedicado. Este nivel fue usado previamente por NetApp, pero ahora ha sido substituido en gran parte por una implementación propietaria de 4 RAID con dos discos de paridad, llamado RAID-DP. [23] La principal ventaja de RAID 4 RAID 2 y 3 es paralelismo de I/O: RAID 2 y 3, una operación de I/O de solo lectura y escritura requiere leer todo el grupo de unidades de datos, mientras que en RAID 4 una lectura/escritura de I/O se operación no tiene difusión en todas las unidades de datos. Como resultado, más operaciones de E/S se pueden ejecutar en paralelo, mejorar el rendimiento de las transferencias pequeñas. [3]
RAID 5
RAID 5 consiste en bandas de nivel de bloque con paridad distribuida. A diferencia de RAID 4, información de paridad se distribuye entre las unidades, que requieren todas las unidades pero uno estar presente para funcionar. En caso de falla de una sola unidad, se pueden calcular lecturas posteriores de la paridad distribuida tal que no hay datos se pierde. RAID 5 requiere al menos tres discos. [13] RAID 5 implementaciones son susceptibles a fallas en el sistema debido a las tendencias en cuanto a tiempo de reconstrucción de la matriz y la posibilidad de falla en la unidad durante la reconstrucción (véase sección de "Aumento reconstrucción tiempo y fracaso probabilidad", abajo). [24] Reconstrucción de una matriz requiere leer todos los datos de todos los discos, abriendo una posibilidad de una segunda falla en la unidad y la pérdida de la matriz completa. En agosto de 2012, Dell publicó una advertencia contra el uso de RAID 5 en cualquier configuración RAID 50 y arreglos de discos de Dell EqualLogic con "Clase 2 7200 RPM unidades de disco de 1 TB y una mayor capacidad" para datos críticos del negocio. [25]
RAID 6
RAID 6 consiste en bandas de nivel de bloque con paridad distribuida doble. Paridad doble proporciona tolerancia a fallos hasta dos unidades que han fallado. Esto hace más grandes grupos RAID más práctico, especialmente para sistemas de alta disponibilidad, como unidades de gran capacidad tardan más en recuperar. RAID 6 requiere un mínimo de cuatro discos. [citación necesitada] Como con RAID 5, falla una sola unidad resulta en disminución del rendimiento de la matriz completa hasta que la unidad que ha fallado ha sido reemplazada. [13] Con una matriz de RAID 6, mediante unidades de múltiples fuentes y fabricantes, es posible mitigar la mayoría de los problemas relacionados con RAID 5. Más las capacidades de los discos y el más grande tamaño de la matriz, más importante resulta elegir RAID 6 en vez de RAID 5. [26] RAID 10 también minimiza estos problemas. [27]

Anidados (híbrido) RAID

Artículo principal: Niveles RAID anidados

En lo que originalmente se denominó híbrido de RAID,[28] muchos controladores de almacenamiento permiten niveles RAID anidar. Los elementos de un RAID pueden ser unidades individuales o arreglos de discos de ellos mismos. Las matrices son raramente anida más de un nivel profundo.[29]

La matriz final se conoce como la matriz superior. Cuando la matriz superior es RAID 0 (tal como en RAID 1 + 0 y RAID 5 + 0), mayoría de los fabricantes omite el "+" (rendimiento RAID 10 y RAID 50, respectivamente).

  • RAID 0 + 1: crea dos franjas y los espejos. Si produce un fallo de disco uno de las rayas ha fallado en este punto está ejecutando eficazmente como RAID 0 con ninguna redundancia, significativamente mayor riesgo se presenta durante la reconstrucción de RAID 1 + 0 como todos los datos de todos los discos de la banda restante tienen que leerse en lugar de sólo de 1 unidad aumentando la posibilidad de un error de lectura irrecuperable (URE) y considerablemente extender la ventana de reconstrucción. [30] [31][32]
  • RAID 1 + 0: crea un conjunto de rayas de una serie de discos espejados. La matriz puede soportar múltiples pérdidas en coche siempre y cuando no hay espejo pierde todas sus unidades.[33]
  • JBOD RAID N + N: Con JBOD (apenas un manojo de discos), es posible concatenar discos, pero también establece volúmenes como RAID. Con grandes capacidades de los discos, escribir y reconstrucción de tiempo pueden aumentar dramáticamente (especialmente, como se describe anteriormente, con RAID 5 y RAID 6). Dividiendo grandes conjuntos RAID en subconjuntos más pequeños y concatenar con JBOD, escritura y reconstrucción de tiempo pueden reducirse. Si un controlador RAID de hardware no es capaz de anidar JBOD con RAID, luego JBOD se logra con RAID por software en combinación con sets volúmenes RAID de la controladora RAID de hardware. Hay otra ventaja en la forma de recuperación ante desastres, si un pequeño RAID subconjunto falla, entonces los datos de los otros subconjuntos RAID no se pierde, reduciendo el tiempo de restauración.

Niveles no estándar

Artículo principal: Niveles RAID estándar

Muchas configuraciones de los niveles básicos de RAID numerados son posibles, y muchas empresas, organizaciones y grupos han creado sus propias configuraciones no estándar, en muchos casos diseñados para satisfacer la especializada las necesidades de un grupo pequeño nicho. Estas configuraciones incluyen lo siguiente:

  • Linux MD RAID 10 proporciona un general controlador RAID que en su diseño "cerca" por defecto un estándar RAID 1 con dos unidades y un estándar RAID 1 + 0 con cuatro unidades; sin embargo, puede incluir cualquier número de unidades, incluyendo números impares. Con su diseño "lejano", puede ejecutar MD RAID 10 rayas y espejo, incluso con sólo dos unidades en f2 diseño; Esto funciona espejado con rayas Lee, dando el desempeño de lectura de RAID 0. Regular de RAID 1, conforme a lo dispuesto por Linux software RAID, de la raya no lee, pero puede realizar lecturas en paralelo.[33][34][35]
  • Hadoop tiene un sistema RAID que genera un archivo de paridad por xor-ing una franja de bloques en un solo archivo HDFS.[36]
  • BeeGFS, el sistema de archivos paralelo, tiene bandas internas (comparable a RAID0 basada en archivos) y opciones conjunto throughput y capacidad de múltiples servidores de replicación (comparable a RAID10 basada en archivos) y se basa normalmente en la parte superior un RAID subyacente a transparentar fallas de disco.

Implementaciones de

La distribución de datos en discos múltiples puede administrarse ya sea dedicado a hardware de computadora o por software. Una solución de software puede ser parte del sistema operativo, firmware y controladores incluidos con un variador estándar (llamado "asistida por hardware software RAID"), o puede residir en el controlador RAID de hardware.

Basado en software

Implementaciones de RAID de software son proporcionadas por muchos modernos sistemas operativos. RAID por software puede ser implementado como:

  • Una capa que múltiples dispositivos, proporcionando así una sola dispositivo virtual (p. ej. Kernel de Linux's md y softraid de OpenBSD)
  • Un genérico más lógico Administrador de volúmenes (suministrado con la mayoría sistemas operativos de servidor, por ejemplo Veritas o LVM)
  • Un componente del sistema de archivos (p. ej. ZFS, GPFS o Btrfs)
  • Una capa que se encuentra por encima de cualquier sistema de archivos y proporciona una protección de paridad a los datos de usuario (por ejemplo, RAID-F)[37]

Algunas avanzadas sistemas de archivos están diseñados para organizar los datos en múltiples dispositivos de almacenamiento directamente, sin necesidad de la ayuda de un administrador de volúmenes lógicos de terceros:

  • ZFS ayudas equivalentes de RAID 0, RAID 1, RAID 5 (RAID-Z), RAID 6 (RAID-Z2) y una versión de triple paridad RAID-Z3. Como siempre rayas sobre nivel superior vdisp, admite equivalentes de 1 + 0, 5 + 0 y 6 + 0 anidar niveles RAID (así como rayas triple paridad fija) pero no otras combinaciones anidadas. ZFS es el sistema de archivo nativo en Solaris y IllumOSy también está disponible en FreeBSD y Linux. Implementaciones de código abierto ZFS se desarrollan activamente bajo la OpenZFS proyecto paraguas.[38][39][40][41][42]
  • GPFS, inicialmente desarrollado por IBM para streaming de medios de comunicación y Análisis escalable, soporta declustered esquemas de protección RAID hasta n + 3. Una particularidad es la prioridad de reconstrucción dinámica que funciona con bajo impacto en el fondo hasta que un pedazo de datos hits n + 0 redundancia, en cuyo caso este pedazo se reconstruye rápidamente a por lo menos n + 1. En la parte superior, GPFS soporta RAID 1 metro de distancia.[43]
  • Btrfs soporta RAID 0, RAID 1 y RAID 10 (RAID 5 y 6 están en desarrollo).[44][45]
  • XFS originalmente fue diseñado para proporcionar un administrador de volumen integrado que soporta concatenación, espejado y estrías de varios dispositivos de almacenamiento físico.[46] Sin embargo, la aplicación de XFS en el kernel de Linux carece del administrador de volumen integrado.[47]

Muchos sistemas operativos proporcionan implementaciones de RAID, incluyendo las siguientes:

  • De Apple macOS y macOS Server soporte RAID 0, RAID 1 y RAID 1 + 0.[48][49]
  • FreeBSD soporta RAID 0, RAID 1, RAID 3 y RAID 5 y todos anidados a través de GEOM módulos y ccd.[50][51][52]
  • Linux's md soporta RAID 0, RAID 1, RAID 4, RAID 5, RAID 6 y todos anidados.[53] También se admiten determinadas operaciones de cambio de tamaño, remodelación/ampliación.[54]
  • Microsoftde soporte de sistemas operativos de servidor RAID 0, RAID 1 y RAID 5. Algunos de los sistemas operativos de escritorio Microsoft soportan RAID. Por ejemplo, Windows XP Professional soporta RAID nivel 0, además de que abarcan varias unidades, pero sólo si utiliza discos dinámicos y volúmenes. Windows XP puede ser modificado para soportar RAID 0, 1 y 5.[55] Windows 8 y Windows Server 2012 presenta una característica similar a RAID conocida como Espacios de almacenamiento, que permite a los usuarios especificar espejado, paridad o no redundancia en forma de carpeta por carpeta.[56]
  • NetBSD es compatible con RAID 0, 1, 4 y 5 a través de su aplicación de software, llamado RAIDframe.[57]
  • OpenBSD es compatible con RAID 0, 1 y 5 a través de su aplicación de software, llamado softraid.[58]

Si falla una unidad de arranque, el sistema debe ser lo suficientemente sofisticado para poder arrancar la restante unidad o unidades. Por ejemplo, considere un ordenador cuyo disco está configurado como RAID 1 (discos espejadas); Si falla la primera unidad de la matriz, entonces cargador de arranque de la primera etapa podría no ser lo suficientemente sofisticados para tratar de cargar la cargador de arranque de segunda etapa de la segunda unidad como un. El cargador de arranque de segunda etapa para FreeBSD es capaz de cargar un núcleo de dicha matriz.[59]

Basada en firmware y controladores

A SATA 3.0 controlador que proporciona la funcionalidad RAID a través de controladores y firmware privativo
Vea también: Metadatos externos MD RAID

-Implementación de software de RAID no es siempre compatible con el proceso de arranque del sistema, y es generalmente impráctico para versiones de escritorio de Windows. Sin embargo, controladoras hardware de RAID son costosos y propietarios. Para llenar este boquete, barato "controladores RAID" fueron introducidos que no contienen un chip de controlador RAID dedicado, sino simplemente una viruta de regulador de disco estándar con firmware propietario y conductores. Durante el arranque temprano, la RAID se implementa mediante el firmware y una vez más totalmente cargado el sistema operativo, los controladores de toman control. En consecuencia, estos controladores no funcionen cuando compatibilidad con el controlador no está disponible para el sistema operativo del host.[60] Un ejemplo es Intel Matrix RAID, implementado en muchas placas base de nivel de consumidor.[61][62]

Porque algunos soporte de hardware mínima participa, este enfoque de implementación también se llama "asistida por hardware RAID por software",[63][64][65] RAID "modelo híbrido",[65] o incluso "fake RAID".[66] Si es compatible con RAID 5, el hardware puede proporcionar un acelerador de hardware XOR. Una ventaja de este modelo sobre el puro software RAID es que — si se utiliza un modo de redundancia, la unidad de arranque está protegida de falta (por firmware) durante el proceso de arranque antes de apoderarse de los controladores de sistemas operativos.[65]

Integridad

Datos de depuración (conocida en algunos ambientes como Patrulla de leer) consiste en periódico leer y comprobar el controlador RAID de todos los bloques en una matriz, incluyendo ésos no accede. Esto detecta bloques defectuosos antes de su uso.[67] Busca de bloques defectuosos en cada dispositivo de almacenamiento en una matriz, pero también utiliza la redundancia de la matriz para recuperar bloques defectuosos en un disco y volver a asignar los datos recuperados a bloques en otras partes de la unidad de limpieza de datos.[68]

Con frecuencia, un controlador RAID está configurado para "soltar" una unidad de componente (es decir, asumir una unidad componente ha fallado) si la unidad ha sido insensible durante ocho segundos o menos; Esto podría provocar que el controlador de matriz a un buen coche porque ese coche no ha recibido suficiente tiempo para completar su procedimiento de recuperación de error interno. En consecuencia, con RAID de unidades de consumo se comercializan puede ser riesgosos y los llamados "clase empresarial" unidades límite este tiempo de recuperación de error para reducir el riesgo.[citación necesitada] Discos escritorio Western Digital solía tener una solución específica. Una utilidad llamada WDTLER.exe limitado el tiempo de recuperación de error de la unidad. La utilidad habilitada TLER (tiempo limitado error de recuperación), que limita el tiempo de recuperación de error a siete segundos. Alrededor de septiembre de 2009, Western Digital había deshabilitado esta característica en sus unidades de escritorio (por ejemplo, la línea Caviar negro), haciendo tales unidades no aptos para su uso en configuraciones de RAID.[69] Sin embargo, Western Digital discos de clase empresarial son enviados de fábrica con TLER habilitado. Tecnologías similares son utilizados por Seagate, Samsung y Hitachi. Por supuesto, para el uso non-RAID, una unidad de la clase de empresa con un tiempo de espera de recuperación de error corto que no se puede cambiar por lo tanto es menos conveniente que una unidad de escritorio.[69] A finales de 2010, el Smartmontools comenzó programa de apoyo a la configuración de Control de recuperación de errores de ATA, permitiendo que la herramienta configurar muchos discos duros de clase de escritorio para uso en las configuraciones de RAID.[69]

Mientras que RAID puede protegerse contra el fallo del disco físico, los datos todavía está expuestos a operador, software, hardware y destrucción de virus. Muchos estudios mencionan falla de operador como la fuente más común de mal funcionamiento,[70] como un operador de servidor reemplazando la unidad incorrecta en un RAID defectuoso y desactivar el sistema (incluso temporalmente) en el proceso.[71]

Una matriz puede ser abrumada por una falla catastrófica que excede su capacidad de recuperación y, por supuesto, la matriz completa corre el riesgo de daños por incendio, desastres naturales y las fuerzas humanas, mientras que copias de seguridad pueden ser almacenados fuera del sitio. Una matriz también es vulnerable a fallo en el controlador porque no siempre es posible migrar a un controlador nuevo, diferente, sin pérdida de datos.[72]

Debilidades

Faltas correlacionadas

En la práctica, las unidades son a menudo la misma edad (con desgaste similar) y para el medio ambiente. Ya que muchas fallas de unidades debido a problemas mecánicos (que están más probables en antiguas unidades), esto viola los supuestos del independiente, idéntica tasa de fracaso entre las unidades; errores de hecho se correlacionan estadísticamente.[13] En la práctica, las posibilidades de un segundo fracaso antes de que el primero ha sido recuperado (causando pérdida de datos) son mayores que las probabilidades de errores al azar. En un estudio de aproximadamente 100.000 unidades, la probabilidad de dos unidades en el mismo cluster fallando dentro de una hora fue cuatro veces mayor que el predicho por la distribución estadística exponencial— que caracteriza a los procesos en que se produzcan eventos continuamente y de manera independiente a una velocidad media constante. La probabilidad de dos fracasos en el mismo período de 10 horas era dos veces tan grande como es predicho por una distribución exponencial.[73]

Errores de lectura no recuperable durante la reconstrucción

Errores de lectura no recuperable (URE) presentan como sector Lee fallas, también conocido como errores de los sectores latente (LSE). La medida de evaluación de los medios de comunicación asociados, de error de pedacito irrecuperable Tasa (UBE), normalmente se garantiza que sea menos de un bit en 1015 para la clase empresarial unidades)SCSI, FC, SAS o SATA) y menos de un bit en 1014 para discos de sobremesa (IDE/ATA/PATA o SATA). Aumento de capacidades de los discos y gran RAID 5 casos han conducido a las tarifas de error máximo es insuficiente para garantizar una recuperación exitosa, debido a la alta probabilidad de un error que ocurre en una o más unidades restantes durante un ataque conjunto reconstrucción.[13][74] Cuando la reconstrucción, esquemas basados en la paridad como RAID 5 son particularmente propensos a los efectos de UREs que afectan no sólo el sector donde se producen, pero también bloques reconstruidos usando ese sector para el cálculo de paridad. Así, una URE durante la reconstrucción de RAID 5 por lo general conduce a un fracaso de reconstrucción completa.[75]

Planes basados en la paridad doble protección, como RAID 6, intentan abordar este tema, proporcionando redundancia que permite fallas en dos unidades de disco; como una desventaja, estos esquemas sufren de pena escribir elevados — el número de veces el medio de almacenamiento se debe acceder durante una operación de escritura único.[76] Esquemas que los datos (espejo) en una forma de unidad a unidad, como RAID 1 y RAID 10, tienen menor riesgo de UREs que mediante cálculo de paridad o espejado entre sistemas particionados.[27][77] Datos de depuración, como proceso en segundo plano, puede ser utilizado para detectar y recuperarse de UREs, efectivamente reduciendo el riesgo de que suceda durante reconstrucciones de RAID y provocando fallas en dos unidades de disco. La recuperación de UREs implica reasignación de sectores afectados de disco subyacente, utilizando el sector de la unidad reasignación de piscina; en el caso de UREs detectados durante la limpieza del fondo, redundancia de datos proporcionado por un sistema completamente operacional de RAID permite los datos que faltan ser reconstruido y reescrito a un sector reasignado.[78][79]

Aumentar la probabilidad de tiempo y la falta de reconstrucción

Capacidad de la unidad ha crecido a un ritmo mucho mayor que la velocidad de transferencia y tasas de error sólo han caído un poco en comparación. Por lo tanto, unidades de mayor capacidad pueden tardar horas e incluso días para reconstruir, tiempo durante el cual otras unidades pueden fallar. El tiempo de reconstrucción también es limitado si la matriz completa está aún en operación a capacidad reducida.[80] Dada una matriz con solo un disco redundante (que se aplica a los niveles RAID 3, 4 y 5 y "clásico" dos unidades RAID 1), falla de una unidad de segundo haría que fracaso completo de la matriz. Aunque los discos tiempo medio entre fallos (MTBF) han aumentado con el tiempo, este aumento no ha mantenido ritmo con la creciente capacidad de las unidades. El tiempo para reconstruir la matriz después de un fallo de disco, así como la posibilidad de un segundo fracaso durante la reconstrucción, han aumentado con el tiempo.[24]

Algunos comentaristas han declarado que el RAID 6 es sólo un "band aid" en este sentido, porque sólo se inicia el problema un poco más abajo del camino.[24] Sin embargo, según el 2006 NetApp estudio de Berriman et al., la probabilidad de fallo disminuye por un factor de aproximadamente 3.800 (concerniente a RAID 5) para una adecuada implementación de RAID 6, incluso cuando se utiliza unidades de materias primas.[81] Sin embargo, si las tendencias observadas en la actualidad la tecnología se mantienen sin cambios, en el año 2019 una matriz RAID 6 tendrán la misma probabilidad de falla como sus contrapartes de RAID 5 en 2010.[74][81]

Espejado de esquemas como RAID 10 tienen un tiempo de recuperación limitada, que requieren la copia de una sola unidad fallida, en comparación con regímenes de paridad como RAID 6, que requieren la copia de todos los bloques de las unidades en una matriz establezca. Triple esquemas de paridad, o triple reflejo, se han sugerido como un método para mejorar la resistencia a la falta de una unidad adicional durante este tiempo de gran reconstrucción.[81]

Atomicidad: incluyendo de inconsistencia de paridad debido a caídas del sistema

El bloqueo del sistema u otros interrupción de una operación de escritura puede resultar en Estados donde la paridad es inconsistente con los datos debido a la no atomicidad del proceso de escritura, tal que la paridad no se puede utilizar para recuperación en caso de una falla de disco (el supuesto agujero de escritura de RAID 5).[13] El agujero de la escritura RAID es un problema de corrupción de datos conocidos en redadas más viejos y de gama bajos, causada por una descarga interrumpida de escrituras a disco.[82]

Este es el modo de falla un poco entendida y raramente mencionado para los sistemas de almacenamiento de información redundantes que no utilizar las funciones transaccionales. Investigador de base de datos Jim Gray escribió "Actualización en lugar es un veneno Apple" durante los primeros días de comercialización de base de datos relacional.[83]

Fiabilidad de la memoria caché de escritura

Hay preocupación por la fiabilidad de la memoria caché de escritura, específicamente con respecto a dispositivos equipados con un caché de escritura, que es un sistema de caché que informa los datos como escrito como está escrito en caché, como cuando está escrito en el soporte no volátil. Si el sistema experimenta una pérdida de alimentación u otro fallo importante, los datos pueden ser irrevocablemente perdidos de la memoria caché antes de alcanzar el almacenamiento no volátil.[84]

Véase también

  • Almacenamiento de información conectado en red (NAS)
  • Arquitecturas de disco no RAID
  • Matriz redundante de memoria independiente
  • S.M.A.R.T.

Referencias

  1. ^ Arpaci-Dusseau, Remzi H.; Arpaci-Dusseau, Andrea C. (2014), Sistemas operativos: Tres piezas fáciles [capítulo: RAID] (PDF), Libros Arpaci Dusseau 
  2. ^ Los padres de la invención: el desarrollo de sistemas de automatización de bibliotecas en el siglo XX. Por Christopher Syed https://books.Google.com/books?id=xUT_d4tN7AgC&LPG=PA103&dq=Ted%20grunau&pg=PA103#v=onepage&q=Ted%20grunau&f=false
  3. ^ a b Patterson, David; Gibson, Garth A.; Katz, Randy (1988). Un caso de matrices redundantes de discos económicos (RAID) (PDF). Conferencias SIGMOD. 2006-12-31. 
  4. ^ Frank Hayes (17 de noviembre de 2003). "La historia hasta ahora". Computerworld. 18 de noviembre, 2016. Patterson recordó los inicios de su proyecto de incursión en 1987. […] 1988: David A. Patterson lidera un equipo que define normas RAID para mejorar el rendimiento, fiabilidad y escalabilidad. 
  5. ^ Randy H. Katz (octubre de 2010). "RAID: un recuerdo Personal de cómo almacenamiento se convirtió en un sistema" (PDF). EECS.umich.edu. IEEE Computer Society. 2015-01-18. No éramos los primeros en pensar en la idea de reemplazar lo que Patterson describió como un disco caro grande lento (SLED) con una matriz de discos baratos. Por ejemplo, el concepto de reflejo de disco, por el tándem, era bien conocido, y algunos productos de almacenamiento de información ya habían sido construidas alrededor de arreglos de discos pequeños. 
  6. ^ Patente 4092732, Norman Ken Ouchi, "Sistema para recuperar datos almacenados en error unidad de memoria", publicado el 30 / 05 / 1978 
  7. ^ "Manual técnico de Hardware de HSC50/70" (PDF). DEC. De julio de 1986. págs. 29, 32. 2014-01-03. 
  8. ^ Patente 4761785, Brian E. Clark, et al., "Paridad separarse para mejorar el acceso al almacenamiento", publicado 1988-08-02 
  9. ^ Patente 4899342, David Potter et. otros., "Método y aparato para funcionamiento multi-unidad Array de recuerdos", publicado el 1990-02-06  Véase también La conexión de la máquina (1988)
  10. ^ "sistema de procesamiento de datos IBM 7030: Manual de referencia" (PDF). bitsavers.trailing-edge.com. IBM. 1960. p. 157. 2015-01-17. Ya que se maneja un gran número de bits en paralelo, es práctico usar comprobación de errores y corrección (ECC) bits y cada byte bit 39 se compone de datos de 32 bits y siete pedacitos ECC. Los bits ECC acompañan todos los datos transferidos hacia o desde los discos de alta velocidad y, en lectura, se utilizan para corregir el error de un solo bit en un byte y detectar más errores múltiples y doble en un byte. 
  11. ^ "IBM Stretch (también conocido como sistema de procesamiento de datos de IBM 7030)". brouhaha.com. 2009-06-18. 2015-01-17. Un típico sistema de procesamiento de datos IBM 7030 podría han sido conformado por las siguientes unidades: [...] IBM 353 unidad de almacenamiento de disco – similar al archivo de disco IBM 1301, pero mucho más rápido. 2.097.152 (2 ^ 21) palabras de 72 bits (64 datos bits y 8 bits ECC), 125.000 palabras por segundo 
  12. ^ "originalmente se denomina matriz redundante de discos baratos, el concepto de RAID fue primero desarrollado en la década de 1980 por Patterson, Gibson y Katz de la Universidad de California en Berkeley. (Comité Consultivo RAID ya que ha sustituido el término económico independiente). "Fundamentos de red de área de almacenamiento; Meeta Gupta; Cisco Press; ISBN 978-1-58705-065-7; Apéndice A.
  13. ^ a b c d e f g h i j Chen, Peter; Lee, Edward; Gibson, Garth; Katz, Randy; Patterson, David (1994). "RAID: fiable de alto rendimiento, almacenamiento de información secundario". ACM Computing encuestas. 26: 145-185. doi:10.1145/176979.176981. 
  14. ^ Donald, L. (2003). "MCSA/MCSE 2006 JumpStart Computadoras y red Basics" (2ª ed.). Glasgow: SYBEX. 
  15. ^ Howe, Denis (ed.). Matrices redundantes de discos independientes de FOLDOC. Diccionario en línea libre de computar. Imperial College Departamento de informática. 2011-11-10. 
  16. ^ Dawkins, Bill y Jones, Arnold. "Formato de datos de disco RAID comunes Especificación" [Storage Networking Industry Association] Colorado Springs, 28 de julio de 2006. Recuperado encendido 22 de febrero de 2011.
  17. ^ "Soluciones RAID de Adaptec híbridas" (PDF). Adaptec.com. Adaptec. 2012. 2013-09-07. 
  18. ^ "Estándar de formato de unidad de disco RAID (DDF) común". SNIA.org. SNIA. 2012-08-26. 
  19. ^ "Diccionario SNIA". SNIA.org. SNIA. 2010-08-24. 
  20. ^ Andrew S. Tanenbaum. Estructura de organización de la computadora 6 ed. p. 95. 
  21. ^ Hennessy, John; Patterson, David (2006). Arquitectura de computadores: Un enfoque cuantitativo, 4 ª ed. p. 362. ISBN 978-0123704900. 
  22. ^ "manual de FreeBSD, capítulo 20.5 GEOM: marco de transformación Modular en disco". 2012-12-20. 
  23. ^ Blanco, Jay; Lueth, Chris (mayo de 2010). "RAID-DP:NetApp implementación de RAID de doble paridad de protección de datos. Técnicos de NetApp Informe TR-3298 ". 2013-03-02. 
  24. ^ a b c Newman, Henry (2009-09-17). "Días RAID pueden ser contados". EnterpriseStorageForum. 2010-09-07. 
  25. ^ Peltoniemi, Mikko (2012-08-07). "Nuevo RAID nivel recomendaciones de Dell". 2012-12-01. 
  26. ^ "por qué RAID 6 deja de funcionar en el año 2019". ZDNet. 22 de febrero de 2010. 
  27. ^ a b Scott Lowe (2009-11-16). "cómo protegerse de RAID-relacionadas con errores de lectura irrecuperable (UREs). TechRepublic.". 2012-12-01. 
  28. ^ Ahora, S.; Selvamani, S.; Ahora, S (1995). "Doble-rayado de discos: una arquitectura RAID híbrido altamente confiable". Actas de la Conferencia Internacional de 1995 en el procesamiento en paralelo: volumen 1. CRC Press. I-146 pp.ff. ISBN 0-8493-2615-X. 
  29. ^ "¿Qué es RAID (matriz redundante de discos baratos)?. StoneFly.com. 2014-11-20. 
  30. ^ "¿por qué es RAID 1 + 0 mejor que RAID 0 + 1?". aput.net. 2016-05-23. 
  31. ^ "RAID 10 Vs RAID 01 (RAID 1 + 0 Vs RAID 0 + 1) explicó con el diagrama". www.thegeekstuff.com. 2016-05-23. 
  32. ^ "Comparación de RAID 10 y RAID 01 | SMB es diario ". www.smbitjournal.com. 2016-05-23. 
  33. ^ a b Jeffrey B. Layton: "Introducción a RAID anidados: 01 RAID y RAID-10", Linux Magazine, 06 de enero de 2011
  34. ^ "Rendimiento, herramientas y preguntas generales de la cabeza del hueso". tldp.org. 25 / 12 / 2013. 
  35. ^ "principal página - Linux-raid". OSDL.org. 2010-08-20. 2010-08-24. 
  36. ^ "Hdfs Raid". Hadoopblog.blogspot.com. 2009-08-28. 2010-08-24. 
  37. ^ "RAID sobre sistema de archivos". 2014-07-22. 
  38. ^ "ZFS - illumos". IllumOS.org. 2014-09-15. 2016-05-23. 
  39. ^ "Crear y destruir ZFS Storage Pools - Oracle Solaris ZFS Administration Guide". Oracle Corporation. 2012-04-01. 27 / 07 / 2014. 
  40. ^ «20.2. El Z File System (ZFS)". FreeBSD.org. 27 / 07 / 2014. 
  41. ^ "doble de RAID-Z de paridad (raidz2) (Solaris ZFS Administration Guide)". Oracle Corporation. 27 / 07 / 2014. 
  42. ^ "Triple paridad RAIDZ (raidz3) (Solaris ZFS Administration Guide)". Oracle Corporation. 27 / 07 / 2014. 
  43. ^ Deenadhayalan, Veera (2011). "General URL archivo sistema (GPFS) RAID nativa" (PDF). UseNix.org. IBM. 2014-09-28. 
  44. ^ «Btrfs Wiki: presentan lista». 2012-11-07. 2012-11-16. 
  45. ^ «Btrfs Wiki: Changelog». 2012-10-01. 2012-11-14. 
  46. ^ Philip Trautman; Jim Mostek. "Escalabilidad y rendimiento en sistemas de ficheros modernos". Linux-xfs.sgi.com. 2015-08-17. 
  47. ^ "Linux RAID Setup – XFS". kernel.org. 2013-10-05. 2015-08-17. 
  48. ^ "Mac OS X: Cómo combinar RAID establece en utilidad de discos". 2010-01-04. 
  49. ^ «Apple Mac OS X Server File Systems». 2008-04-23. 
  50. ^ "Página del Manual del administrador del sistema FreeBSD para GEOM(8)". 2009-03-19. 
  51. ^ "lista de correo freebsd-geom - nueva clase / geom_raid5". 2009-03-19. 
  52. ^ «Kernel de FreeBSD Interfaces Manual para CCD (4)». 2009-03-19. 
  53. ^ "El Software RAID HowTo". 2008-11-10. 
  54. ^ "mdadm(8) - página de Linux". Linux.Die.net. 2014-11-20. 
  55. ^ "Uso de Windows XP para hacer RAID 5 a pasar". Tomshardware.com. 2010-08-24. 
  56. ^ Sinofsky, Steven. "La virtualización de almacenamiento de información para escala, flexibilidad y eficiencia". Microsoft. 
  57. ^ Metzger, Perry (1999-05-12). «Anuncio de lanzamiento de NetBSD 1.4». NetBSD.org. La Fundación de NetBSD. 2013-01-30. 
  58. ^ "Página de man de softraid de OpenBSD". OpenBSD.org. 2015-10-05. 
  59. ^ "Manual de FreeBSD". Capítulo 19 GEOM: Marco de transformación de disco Modular. 2009-03-19. 
  60. ^ "SATA RAID FAQ". ATA.wiki.kernel.org. 2011-04-08. 2012-08-26. 
  61. ^ Red Hat Enterprise Linux - Guía del administrador de almacenamiento de información - tipos de RAID
  62. ^ Charlie Russel; Sharon Crawford; Andrew Edney (2011). Trabajar con Windows Small Business Server 2011 Essentials. O ' Reilly Media, Inc. p. 90. ISBN 978-0-7356-5670-3. 
  63. ^ Bloque de Warren. "19,5. Dispositivos RAID de software". FreeBSD.org. 27 / 07 / 2014. 
  64. ^ Ronald L. Krutz; James Conley (2007). Fundamentos de seguridad de red de vías Wiley. John Wiley & Sons. p. 422. ISBN 978-0-470-10192-6. 
  65. ^ a b c ¿RAID hardware vs Software RAID: que aplicación es mejor para mi aplicación? Adaptec Whitepaper
  66. ^ Gregory Smith (2010). PostgreSQL 9.0: Alto rendimiento. Packt editorial Ltd. p. 31. ISBN 978-1-84951-031-8. 
  67. ^ Ulf Troppens, Wolfgang Mueller-Friedt, Rainer Erkens, Rainer Wolafka, Nils Haustein. Explicación sobre redes de almacenamiento de información: Fundamentos y aplicación de Fibre Channel SAN, NAS, ISCSI, InfiniBand y FCoE. Juan Wiley e hijos, 2009. p.39
  68. ^ Dell Computers, fondo patrulla lectura para controladores de Dell PowerEdge RAID, por Drew Habas y John Sieber, reimpreso de Dell Power Solutions, febrero de 2006 https://www.Dell.com/downloads/global/Power/ps1q06-20050212-habas.pdf
  69. ^ a b c "Control de la recuperación de errores con Smartmontools". de 2011.  Comprobar los valores de fecha: fecha de |Access = (Ayuda)
  70. ^ Estos estudios son: gris, J (1990), Murphy y Gent (1995), Kuhn (1997) y Enríquez P. (2003).
  71. ^ Patterson, D., Hennessy, J. (2009), 574.
  72. ^ "La aventura de la migración de RAID". 2010-03-10. 
  73. ^ Disco de fracasos en el mundo Real: ¿un MTTF de 1.000.000 horas significa a usted? Bianca de Schroeder y Garth A. Gibson
  74. ^ a b Harris, Robin (2010-02-27). "RAID 6 deja en 2019?". StorageMojo.com. TechnoQWAN. 17 / 12 / 2013. 
  75. ^ J.L. Hafner, V. Deenadhaylan, K. Rao y J.A. Tomlin. "métodos de matriz para la reconstrucción de datos perdidos en los códigos de la borradura. Conferencia de USENIX sobre archivo y tecnologías de almacenamiento, p15-30, 13-16 de diciembre de 2005.
  76. ^ Miller, Scott Alan (2016-01-05). "Rendimiento de RAID comprensión en varios niveles". Zona de recuperación. StorageCraft. 2016-07-22. 
  77. ^ Arte S. Kagel (02 de marzo de 2011). "RAID 5 y RAID 10 (o incluso RAID 3 o RAID 4)". miracleas.com. 30 de octubre, 2014. 
  78. ^ M.Baker M.Shah, D.S.H. Rosenthal, M.Roussopoulos, P.Maniatis, T.Giuli y P.Bungale. Una nueva mirada a la confiabilidad del almacenamiento de información digital a largo plazo. "EuroSys2006, abril de 2006.
  79. ^ "L.N. Bairavasundaram, GR Goodson, S. Pasupathy, J.Schindler. "Un análisis de errores de los sectores latente en unidades de disco". Procedimientos de SIGMETRICS'07, 12-16 de junio de 2007." (PDF). 
  80. ^ Patterson, D., Hennessy, J. (2009). Diseño y organización de computadoras. Nueva York: Editores de Morgan Kaufmann. PP 604-605.
  81. ^ a b c Leventhal, Adán (2009-12-01). "triple paridad RAID y más allá. Coleta ACM, Asociación de maquinaria de computación". 2012-11-30. 
  82. ^ ""Escribir agujero"en RAID 5, RAID 6, RAID 1 y otros arreglos de discos". Equipo ZAR. 15 de febrero 2012. 
  83. ^ Jim Gray: El concepto de transacción: virtudes y limitaciones (Papel de invitado) VLDB 1981: 144-154
  84. ^ «Definición de caché de escritura en el Diccionario SNIA». 

Acoplamientos externos

  • RAID en DMOZ
  • "Medidas empíricas de las tasas de falla de disco y Error", por Jim Gray y Catharine van Ingen, diciembre de 2005
  • Las matemáticas de RAID-6, por H. Peter Anvin
  • ¿Ofrece alguna ventaja sobre el RAID de Software RAID falso? – Discusión sobre Superuser.com
  • Comparación de métodos de implementación de RAID – Dell.com
  • BAARF: Batalla contra cualquier Raid 5 (RAID 3, 4 y 5 y RAID 10)
  • Ver pizarra limpiar disco de limpieza


Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=RAID&oldid=773043065"