Sistema de archivos en clúster

Ir a: navegación, búsqueda de
"Network file system" y "Parallel file system" redirección aquí. Para los protocolos específicos, vea Network File System y Sistema IBM General Parallel File.
No debe confundirse con cluster de datos.

A sistema de archivos en clúster es un sistema de archivos que es compartida por ser simultáneamente montado en múltiples servidores. Existen varios enfoques para clustering, la mayoría de los cuales no emplean un sistema de archivos en clúster (solamente almacenamiento de conexión directa para cada nodo). Sistemas de archivos en clúster pueden proporcionar funciones como independiente de la ubicación de direccionamiento y redundancia que mejoran la confiabilidad o reducen la complejidad de las otras partes del racimo. Sistemas de archivos paralelos son un tipo de sistema de archivos en clúster que difundir datos a través de múltiples nodos de almacenamiento, generalmente para redundancia o rendimiento.[1]

Contenido

  • 1 Disco compartido / red de área de almacenamiento
    • 1.1 Ejemplos
  • 2 Sistemas de archivos distribuidos
    • 2.1 Objetivos de diseño
    • 2.2 Historia
    • 2.3 Ejemplos
  • 3 Almacenamiento de información conectado en red
  • 4 Consideraciones de diseño
    • 4.1 Evitando el punto único de falla
    • 4.2 Rendimiento
    • 4.3 Simultaneidad
  • 5 Historia
  • 6 Véase también
  • 7 Referencias
  • 8 Lectura adicional

Disco compartido / red de área de almacenamiento

Vea también: Sistemas de archivos de disco compartido

A sistema de archivos de disco compartido utiliza un Storage area network (SAN) para proporcionar acceso a disco directo desde varios ordenadores en la a nivel de bloque. Control de acceso y traducción de operaciones de nivel de archivo que utilizan las aplicaciones a las operaciones de nivel de bloque utilizadas por el SAN deben ocurrir en el nodo del cliente. El tipo más común de los sistemas de archivos en clúster es sistema de archivos de disco compartido, que — mediante la adición de los mecanismos de control de concurrencia— proporciona un consistente y serializable vista del sistema de archivos, evitando la corrupción y no deseados pérdida de datos incluso cuando varios clientes intentan acceder a los mismos archivos al mismo tiempo. Es una práctica común para los sistemas de archivos de disco compartido a emplear algunos una especie de esgrima mecanismo para prevenir la corrupción de datos en caso de fallas de nodos, porque un dispositivo no alambrado puede causar corrupción de datos si se pierde la comunicación con su hermana nodos y trata de acceder a la misma información accediendo otros nodos.

La red de área de almacenamiento subyacente puede utilizar cualquiera de una serie de protocolos de nivel de bloque, incluidos SCSI, iSCSI, HyperSCSI, ATA over Ethernet (AoE), Fibre Channel, dispositivo de bloqueo de red, y InfiniBand.

Existen diferentes enfoques de arquitectura de un sistema de archivos de disco compartido. Algunos distribuyan información de archivo a través de todos los servidores en un clúster (totalmente distribuido). Otros utilizan un centralizado metadatos servidor. Ambos logran el mismo resultado de permitir que todos los servidores de acceso a todos los datos en un dispositivo de almacenamiento compartido.[citación necesitada]

Ejemplos

  • Silicon Graphics (SGI) agrupado (sistema de archivoCXFS)
  • Veritas Cluster File System
  • DataPlow Nasan Sistema de archivos
  • Sistema de archivo de SAN DataPlow (SFS)
  • Sistema IBM General Parallel File (GPFS)
  • Microsoft Clúster compartido volúmenes (CSV)
  • Oracle Cluster File System (OCFS)
  • Soluciones de almacenamiento de PolyServe
  • Cuántica StorNext FileSystem (SNF), ex ex ADIC, CentraVision sistema de archivos (CVFS)
  • Sistema de archivos en cluster ballena azul (BWFS)
  • Red Hat Global File System (GFS)
  • Sanbolic Melio FS sistema de archivos en clúster
  • Sol QFS
  • TerraScale tecnologías TerraFS
  • VMware VMFS
  • Xsan

Sistemas de archivos distribuidos

Sistemas de archivos distribuidos No bloquear el acceso al almacenaje del mismo nivel pero usa una red Protocolo.[2][3] Estos son comúnmente conocidos como sistemas de archivos de red, aunque no son el único sistema de archivo que usan la red para enviar datos.[citación necesitada] Sistemas de archivos distribuidos pueden restringir el acceso al sistema de archivos depende listas de acceso o capacidades en los servidores y los clientes, dependiendo de cómo se diseña el protocolo.

La diferencia entre un sistema de archivos distribuido y un almacén de datos distribuidos es que un sistema de archivos distribuido permite acceder utilizando las mismas interfaces y semántica como archivos locales - por ejemplo, montaje/desmontaje, listado de directorios, en los límites de byte, modelo permiso nativa del sistema de lectura/escritura a los archivos. Distribuyen datos de tiendas, por el contrario, requieren el uso de un API o biblioteca diferentes y tienen diferente semántica (más a menudo los de una base de datos).

Objetivos de diseño

Distribuyen archivo sistemas que tienen como objetivo de "transparencia" en una serie de aspectos. Es decir, pretenden ser "invisible" para los programas cliente, que "ven" un sistema que es similar a un sistema de archivos local. Detrás de las escenas, el sistema de archivos distribuido encarga de localizar archivos, transporte de datos, y potencialmente proporcionar otras funciones enumerados a continuación.

  • Transparencia de acceso es que los clientes son conscientes de que los archivos se distribuyen y pueden acceder a ellos de la misma manera como se accede a los archivos locales.
  • Transparencia de la ubicación; un espacio de nombres coherente existe abarcando archivos locales como remotos. El nombre de un archivo no da su ubicación.
  • Transparencia de simultaneidad; todos los clientes tienen la misma visión del estado del sistema de archivos. Esto significa que si un proceso está modificando un archivo, otros procesos en el mismo sistema o sistemas remotos que accedan a los archivos a ver las modificaciones de forma coherente.
  • Transparencia de fracaso; los programas cliente y cliente deben funcionar correctamente después de una falla en el servidor.
  • Heterogeneidad; servicio de archivos debe proporcionarse a través de diferentes plataformas de hardware y sistemas operativos.
  • Escalabilidad; el sistema de archivos debe trabajar bien en entornos pequeños (1 máquina, una docena de máquinas) y también escalar con dignidad a los enormes (cientos a través de decenas de miles de sistemas).
  • Transparencia de replicación; apoyo de escalabilidad, que queramos replicar archivos a través de múltiples servidores. Clientes deben ser conscientes de esto.
  • Transparencia de migración; archivos deben ser capaces de moverse sin conocimiento del cliente.

Historia

El Sistema de tiempo compartido incompatible utiliza dispositivos virtuales para acceso transparente entre máquina sistema de ficheros en la década de 1960. Más servidores de archivos se desarrollaron en la década de 1970. En 1976 Digital Equipment Corporation creado el Oyente de acceso de archivo (FAL), una implementación de la Protocolo de acceso a datos como parte de DECnet Fase II que se convirtió en el primer sistema de archivo de red ampliamente utilizados. En 1985 Sun Microsystems creado el sistema de archivos denominado"Network File System"(NFS) que se convirtió en el primer ampliamente utilizado Protocolo de Internet basado en sistema de archivos de red.[3] Otros sistemas de archivos de red notables son Andrew File System (AFS), Apple Filing Protocol (AFP), NetWare Core Protocol (NCP), y Server Message Block (SMB) que también es conocido como común Internet File System (CIFS).

Ejemplos

  • GFS (Google Inc.)
  • HDFS (Apache Software Foundation)
  • IFS (EMC Isilon)
  • Cefalometría (Inktank, Red Hat)
  • MooseFS (Tecnología de base / Gemius)
  • Windows sistema de archivos distribuido (DFS) (Microsoft)
  • BeeGFS (Fraunhofer)
  • GlusterFS (Red Hat)
  • Lustre
  • IBRIX

Almacenamiento de información conectado en red

Artículo principal: Almacenamiento de información conectado en red

Almacenamiento de información conectado en red (NAS) proporciona almacenamiento y un sistema de archivos, como un sistema de archivos de disco compartido en la cima de una red de área de almacenamiento (SAN). NAS típicamente utiliza protocolos basados en archivos (a diferencia de los protocolos basados en bloques que utilizaría un SAN) tales como NFS (popular en UNIX sistemas), (SMB/CIFSServidor mensaje bloque/Common Internet File System) (usado con sistemas MS Windows), AFP (se utiliza con Apple Macintosh ordenadores), o NCP (usado con OES y Novell NetWare).

Consideraciones de diseño

Evitando el punto único de falla

El fallo del hardware de disco o un nodo de almacenamiento determinado en un clúster puede crear un punto único de falla Eso puede resultar en pérdida de datos o falta de disponibilidad. Tolerancia a fallos y alta disponibilidad puede ser proporcionada a través de replicación de datos de un tipo u otro, así que los datos sigue intacto y disponible a pesar del fracaso de cualquier pieza de equipo. Para obtener ejemplos, vea las listas de sistemas de archivos distribuidos tolerantes a fallos y sistemas de archivos tolerantes paralelo distribuido.

Rendimiento

Un campo común rendimiento medición un archivo agrupado de sistema es la cantidad de tiempo necesario para satisfacer las solicitudes de servicio. En los sistemas convencionales, esta vez consiste en un tiempo de acceso al disco y una pequeña cantidad de CPU-tiempo de procesamiento. Pero en un sistema de archivos en clúster, un acceso remoto tiene sobrecarga adicional debido a la estructura distribuida. Esto incluye el tiempo para entregar la solicitud a un servidor, el momento de entregar la respuesta al cliente y para cada dirección, una CPU arriba del funcionamiento del Protocolo de comunicación software.

Simultaneidad

Control de concurrencia se convierte en un problema cuando más de una persona o cliente esté accediendo al mismo archivo o bloque y quiero actualizarlo. Por lo tanto, actualizaciones del archivo de un cliente no deben interferir con el acceso y actualización de otros clientes. Este problema es más complejo con sistemas de archivos debido a concurrente escribe superpuesto, donde diversos escritores escriben a superposición regiones del archivo concurrentemente.[4] Este problema es generalmente manejado por control de concurrencia o bloqueo que pueden ser incorporadas en el sistema de archivos o proporcionados por un Protocolo complementario.

Historia

Mainframes de IBM en los años setenta pudieran compartir sistemas de archivos y discos físicos si cada máquina tenía su propia conexión de canal a las unidades de control de las unidades. En la década de 1980, Digital Equipment Corporationes TOPS-20 y VAX/VMS racimos incluyen sistemas de archivos de disco compartido.[citación necesitada]

Véase también

  • NAS en cluster
  • Almacenamiento de información empresarial
  • Recurso compartido
  • Almacenamiento de conexión directa
  • Intercambio de archivos peer-to-peer
  • Compartir el disco
  • Almacén de datos distribuidos
  • Sistema de archivos global
  • Gopher (protocolo)
  • Lista de los sistemas de archivos distribuidos
  • CacheFS
  • RAID

Referencias

  1. ^ https://www.Dell.com/downloads/global/Power/ps2q05-20040179-Saify-OE.pdf
  2. ^ Silberschatz, Galvin (1994). Conceptos de sistema operativo, capítulo 17 Sistemas de archivos distribuidos. Editorial Addison-Wesley. ISBN 0-201-59292-4.
  3. ^ a b Arpaci-Dusseau, Remzi H.; Arpaci-Dusseau, Andrea C. (2014), Network File System del sol, Arpaci-Dusseau libros
  4. ^ Pessach, Yaniv (2013). Almacenamiento distribuido: Conceptos, algoritmos e implementaciones. ISBN 978-1482561043.

Lectura adicional

  • Una taxonomía de los sistemas de almacenamiento distribuido
  • Una encuesta sobre sistemas de archivos distribuidos y taxonomía
  • Un estudio de los sistemas de archivos distribuidos
  • La evolución de los sistemas de archivos

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=Clustered_file_system&oldid=634077200"