Almacén de datos distribuidos

Ir a: navegación, búsqueda de

A almacén de datos distribuidos es un red informática donde la información se almacena en más de una nodo, a menudo en un replicado moda.[1] Específicamente generalmente se utiliza para referirse a cualquiera un base de datos distribuida donde los usuarios almacenan información en un número de nodos, o un red informática en que los usuarios almacenan información en un número de nodos de la red entre pares.

Contenido

  • 1 Bases de datos distribuidas
  • 2 Almacenes de datos de nodo de red de pares
  • 3 Ejemplos
    • 3.1 Bases de datos no relacionales distribuidas
    • 3.2 Almacenes de datos de nodo de red de pares
  • 4 Véase también
  • 5 Referencias

Bases de datos distribuidas

Bases de datos distribuidas son generalmente bases de datos no relacionales posibilitan un acceso rápido a datos sobre un gran número de nodos. Algunas bases de datos distribuidas exponen habilidades consulta ricos mientras otros se limitan a un tienda de clave y valor semántica. Son ejemplos de bases de datos distribuidas limitadas Googlees BigTable, que es mucho más que un sistema de archivos distribuido o un red peer-to-peer,[2] Amazonases Dinamo[3] y Windows Azure Storage.[4]

Como la capacidad de consultas arbitrarios no es tan importante como el disponibilidad de, los diseñadores de los almacenes de datos distribuidos han aumentado este último en un gasto de consistencia. Pero el acceso de alta velocidad de lectura/escritura resulta en menor consistencia, ya que no es posible tener ambos consistencia, disponibilidad y tolerancia de la partición de la red, como se ha demostrado por el Teorema del CAP.

Almacenes de datos de nodo de red de pares

En almacenes de datos de red entre pares, el usuario puede corresponder generalmente y que otros usuarios puedan utilizar su computadora como un nodo de almacenamiento también. Información puede o puede no ser accesible a otros usuarios dependiendo del diseño de la red.

Mayoría Peer-to-peer las redes no tienen almacenes de datos distribuidos en que los datos del usuario sólo están disponibles cuando su nodo en la red. Sin embargo, esta distinción algo borrosa en un sistema como BitTorrent, donde es posible para el nodo de origen a trabajar fuera de línea, pero el contenido a seguir ser servido. Aún así, esto es sólo el caso de archivos individuales solicitados por los redistribuidores, como contraste con una red como Freenet donde todos los equipos están a disposición de servir a todos los archivos.

Distribuyen datos tiendas suelen utilizan un corrección y detección de errores técnica. Algunos distribuyen los almacenes de datos (tales como Parchive sobre NNTP) usa corrección de errores hacia adelante técnicas para recuperar el archivo original cuando partes de ese archivo están dañado o no disponible. Otros vuelve a descargar ese archivo desde un espejo diferente.

Ejemplos

Bases de datos no relacionales distribuidas

  • Apache Cassandra, de almacén de datos anteriores de Facebook
  • BigTable, el almacén de datos de Google
  • Druida (almacén de datos de código abierto), utilizado por Netflix
  • Dinamo de Amazonas
  • HBase, plataforma de tienda de datos actual de Facebook de mensajería
  • Riak
  • Voldemort, almacén de datos utilizado por LinkedIn

Almacenes de datos de nodo de red de pares

  • BitTorrent
  • Proyecto acorde
  • GNUnet
  • Freenet
  • Unidad, del software Perfect Dark
  • Mnet
  • NNTP (los datos distribuidos protocolo de almacenamiento utilizado para Usenet Noticias)
  • Storage@Home
  • Tahoe-LAFS

Véase también

Portal icon Portal científico de computadoras
  • Almacén de datos
  • Sistema de archivos distribuido
  • Keyspace, el DDS esquema
  • Peer-to-peer
  • Tabla hash distribuido
  • Caché distribuido

Referencias

  1. ^ Yaniv Pessach, Almacenamiento distribuido (Almacenamiento distribuido: conceptos, algoritmos e implementaciones ed.)
  2. ^ "BigTable: Google está distribuido el almacén de datos". https://The-Paper-Trail.org/:: Rastro de papel. 2011-04-05. Aunque GFS ofrece Google con almacenamiento de archivos distribuidos escalable, confiable, no proporciona ninguna facilidad para estructurar los datos contenidos en los archivos más allá de una estructura jerárquica de directorios y nombres de archivo significativo. Es bien sabido que se necesitan para conjuntos de datos grandes soluciones más expresivas. Terabytes de Google sobre terabytes de datos que recuperan de los rastreadores web, entre muchas otras fuentes, necesita organizar, para que las aplicaciones cliente rápidamente pueden realizar consultas y actualizaciones en una granularidad más fina que el nivel de archivos. [...] Lo primero que necesitas saber sobre BigTable es que no es una base de datos relacional. Esto debería ser ninguna sorpresa: un tema persistente a través de todos estos grandes papeles de almacén de datos distribuidos es que RDBMS son difíciles de hacer con un buen rendimiento. No hay ningún esquema duro, fijo en un BigTable, no hay integridad referencial entre las tablas (sin llaves foraneas) y por lo tanto poco apoyo para las combinaciones optimizadas.
  3. ^ Sarah Pidcock (2011-01-31). "Dínamo: almacén de clave y valor altamente disponibles de Amazon". https://www.cs.uwaterloo.CA/:: WATERLOO – CHERITON ESCUELA DE CIENCIAS DE LA COMPUTACIÓN. p. 2/22. 2011-04-05. Dínamo: un almacén de datos distribuidos altamente disponibles y escalables
  4. ^ "Windows Azure Storage". 2011-09-16. 6 de noviembre 2011.

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=Distributed_data_store&oldid=613722424"