NCSA marrón perro
|
|
NCSA marrón perro es un proyecto de investigación de la National Center for Supercomputing aplicaciones que es financiado por el Fundación Nacional de ciencia (NSF).[1] El objetivo del proyecto es desarrollar un método para acceder fácilmente a los datos de la investigación histórica almacenados en computadoras y software para mantener la viabilidad a largo plazo de grandes cuerpos de investigación científica.
Perro marrón es parte de la DataNet Programa de socios financiado por la NSF en 2008. DataNet fue concebido para abordar la naturaleza cada vez más digital y uso intensivo de datos de la ciencia, ingeniería, investigación y educación. Perro marrón es parte de un esfuerzo de seguimiento llamado Bloques de construcción de infraestructura de datos (DIBBs), se centró en la creación de software para apoyar los esfuerzos de DataNet. El proyecto de perro marrón fue propuesto por los investigadores del NCSA y el University of Illinois Urbana-Champaign así como investigadores de La Universidad de Boston y el University of North Carolina at Chapel Hill.
Contenido
- 1 Problema de investigación
- 1.1 Datos no estructurados, Uncurated, larga cola
- 2 Enfoque perro marrón
- 3 Tecnología de perro marrón
- 3.1 Datos de labranza servicio - DTS
- 3.2 Datos Proxy de acceso - DAP
- 4 Casos de uso de perro marrón
- 4.1 Cambio de vegetación larga cola datos Global en ecología y biología
- 4.2 Diseño de infraestructura verde considerando aguas pluviales y requerimientos humanos
- 4.3 Desarrollo y aplicación de estudios de la zona crítica
- 5 Premio NSF
- 6 Referencias
- 7 Enlaces externos
Problema de investigación
Datos no estructurados, Uncurated, larga cola
Gran parte de los datos generados por la ciencia, ciencias sociales y Humanidades es más pequeño, no estructurado, comisariado de Naciones Unidas y por lo tanto no fácilmente compartida. En el mundo científico, que esto se refiere a veces como "cola larga" datos, tomando prestado un término de estadísticas y refiriéndose a la cola de la distribución de tamaños de proyecto, con la gran mayoría de los proyectos más pequeños no tienen los recursos para gestionar adecuadamente los datos que producen. Este supuesto datos "cola larga", tanto pasado como presente, tienen el potencial para informar a futuras investigaciones en muchas áreas de estudio; Sin embargo, gran parte de esta información se ha convertido en gran parte inaccesible debido a formatos de software y archivos obsoletos. La inaccesibilidad de estos datos y la realidad de obsolescencia digital, significa que la integridad de la investigación científica es sí mismo cada vez más en riesgo porque ya no es reproducible.
[2]
Enfoque perro marrón
Perro marrón se describe como el "súper perro" del software[3] (de ahí el nombre "Brown Dog"), que sirve como una infraestructura de datos bajo nivel al interfaz con contenido de datos digitales a través de la web. En lugar de empezar desde cero, su enfoque es utilizar toda posible fuente de ayuda automatizable (es decir, software) ya en existencia en un robusto y procedencia forma conservadora para crear un servicio que puede ocuparse tanto de datos como sea posible.[4] El proyecto considera el impacto más amplio de su trabajo en su potencial para servir no sólo la comunidad científica, pero el público en general como una especie de "DNS para datos", con el objetivo de hacer que todos los datos y todos los formatos de archivo tan accesible como las páginas web son hoy en día.
Tecnología de perro marrón
Perro marrón pretende abordar los problemas que implican el uso de las colecciones de datos estructurados y uncurated a través del desarrollo de dos servicios: el Proxy de acceso datos (DAP) para ayudar en la conversión de formatos de archivo y los datos de labranza Services (DTS) para la extracción automática de metadatos del contenido del archivo. Una vez desarrollados, los investigadores y usuarios en general públicos será capaces de descargar los plugins de navegador y otras herramientas del catálogo de herramienta perro marrón.[1][5] T
Datos de labranza servicio - DTS
El DTS, permitirá a los usuarios buscar colecciones de datos utilizando un archivo existente para descubrir otros archivos similares en los datos. Una vez más, una vez que están configurados los ajustes de la máquina y navegador, un campo de búsqueda se anexarán al navegador donde se pueden dejar archivos de ejemplo el usuario. Haciendo esto desencadena el DTS para buscar el contenido de todos los archivos en una determinada dirección URL para archivos similares a la proporcionada por el usuario. Por ejemplo, mientras navega por una colección de imágenes en línea, un usuario podría caer una imagen de tres personas en el campo de búsqueda y el DTS volvería todas las imágenes de la colección que contiene también tres personas. Si el DTS se encuentra con un formato de archivo que no es capaz de analizar, utilizará el DAP para hacer accesible el archivo. El DTS también realizar la indexación de direcciones generales de los datos y extraer y añadir metadatos de archivos y colecciones permitiendo a los usuarios obtener algún sentido del tipo de datos que están encontrando.
Este servicio funciona en Puerto 9443.
Datos Proxy de acceso - DAP
DAP de Brown perro permite a los usuarios acceder sin problemas a archivos de datos que serían ilegibles en sus dispositivos de cliente. Similar a un gateway de internet o servicio de nombres de dominio (DNS), la configuración del DAP entró en configuración de la máquina de un usuario y olvidada después de eso. De entonces encendido, con modificaciones en la forma de plugins para la mayoría de los navegadores, las solicitudes de datos sobre HTTP primero podría ser examinadas por el DAP para determinar si el formato de archivo nativo es legible en el dispositivo cliente. Si no, el DAP se llamaría en el fondo para convertir el archivo en el mejor posible formato legible por la máquina del cliente. Alternativamente, el usuario tendría la opción de especificar el formato deseado, en vez de hacerlo automáticamente el DAP.
Este servicio funciona en Puerto 8184.
Casos de uso de perro marrón
El perro marrón tecnología se desarrollarán en el contexto de tres identificados usar casos propuestos por los grupos dentro de la EarthCube comunidades de investigación. Los desarrolladores e investigadores de algunas de estas comunidades trabajarán juntos para explorar tres casos de uso científico convincente que abarcan Geociencia, Ingeniería, Biología y Ciencias sociales.
Cambio de vegetación larga cola datos Global en ecología y biología
dirigido por Michael Dietze, La Universidad de Boston
Datos sobre la estructura del tamaño de la vegetación, abundancia y composición de especies están críticamente importantes para una amplia gama de subdisciplinas en ecología, conservación, manejo de recursos naturales y Biología del cambio global. Sin embargo, abordar muchas de las cuestiones apremiantes en estas disciplinas requerirá que la biosfera terrestre y los modelos hidrológicos son capaces de asimilar la gran cantidad de datos de cola larga que existe, pero es en gran parte inaccesible. El equipo de Brown Dog en colaboración con investigadores del laboratorio de Dietze facilitará la captura de un enorme cuerpo menores vegetación orientadas a la investigación de conjuntos de datos recopilados por muchas décadas y datos históricos vegetación incrustados en los datos de la encuesta sobre la tierra pública data de 1785. Estos datos se utilizará como condiciones iniciales para los modelos, sentido de otros grandes conjuntos de datos y para la validación y calibración del modelo.[1][6]
Diseño de infraestructura verde considerando aguas pluviales y requerimientos humanos
dirigido por Barbara Minsker, Universidad de Illinois en Urbana-Champaign; William Sullivan, Universidad de Illinois en Urbana-Champaign; Arthur Schmidt, Universidad de Illinois en Urbana-Champaign
Este estudio de caso implica el desarrollo de criterios de diseño de infraestructura verde novela y modelos que integran los requisitos para la gestión del agua de tormenta y ecosistema y la salud humana y el bienestar. Para abordar los problemas científicos y sociales relacionados con el diseño de espacios verdes, la disponibilidad y accesibilidad a los datos es un gran desafío. Este estudio centrará en áreas identificadas de la región verde saludable barrio planificación dentro de la ciudad de Chicago donde es más deficiente rendimiento local alcantarilla existente y donde los cambios en la superficie impermeable a través de infraestructura verde sería beneficiosos para barrios marginados. Perro marrón se utilizará para extraer datos experimentales de cola larga en las preferencias del paisaje humano e impactos sobre la salud. Esta información se utilizará para desarrollar un modelo de los impactos de la salud humana que entonces estará vinculado junto con un modelo de la biosfera terrestre y un modelo de agua de tormenta usando tecnología de perro marrón.[1]
Desarrollo y aplicación de estudios de la zona crítica
dirigido por Praveen Kumar, Universidad de Illinois en Urbana-Champaign
Zona crítica (CZ) es la "piel" de la tierra que se extiende desde las copas de los árboles a la roca que es creada por los procesos de vida trabajando en las escalas de los microbios a biomas. La zona crítica es compatible con todos los sistemas vivos terrestres. Su parte superior es el biomantle. Esto es donde biota terrestre en vivo, reproducir, utilizar y gastar energía, y donde sus desechos y restos se acumulan y se descomponen. Abarca el suelo, que actúa como una geomembrana a través del cual el agua y solutos, energía, gases, sólidos y los organismos interactúan con la atmósfera, la Biosfera, hidrosfera y litosfera. Una variedad de controladores afecta a esta zona biodinámica, que van desde el clima y la deforestación para la agricultura, el desarrollo humano y pastoreo. Entender y predecir estos efectos es central para gestionar y mantener servicios de los ecosistemas vitales tales como la fertilidad del suelo, purificación del agua y la producción de recursos alimentarios y, en mayor escala, global de carbono bicicleta y secuestro de carbono. La CZ proporciona un marco unificador para integrar entornos próximos a la superficie y la superficie terrestre y refleja una intrincada red de procesos biológicos y químicos e impactos humanos que ocurren en vastamente diferentes escalas temporales y espaciales. La naturaleza de estos datos crear desafíos significativos de estudios interdisciplinarios de la CZ porque la integración de la variedad y cantidad de productos de datos y modelos ha sido un obstáculo. Por otro lado, datos CZ proporcionan una excelente oportunidad para definir, probar e implementar tecnologías de perro marrón. En este contexto "no estructurados" datos se consideran ampliamente que consta de una colección de datos heterogéneos con formatos que reflejan legados temporales y disciplinarios, datos de emergente hardware abierto bajo costo basado en sensores y redes de sensores que carecen de metadatos definidos y las características del sensor, así como datos que están disponibles como mapas, imágenes y texto incrustado.[1]
Premio NSF
CIF21 DIBBs: perro marrón fue galardonado en el invierno de 2013 con una fecha de inicio del 01 de octubre de 2013. Fecha de vencimiento estimado es el 30 de septiembre de 2018.[7]
El monto del premio fue de $10,519,716.00, el más grande de todos los DIBBs premios. El investigador principal es Kenton McHenry del centro nacional para aplicaciones de Supercomputación (NCSA) de la Universidad de Illinois en Urbana-Champaign. CoPIs son Jong Lee NCSA/UIUC; Barbara Minsker, Ingeniería Civil y ambiental, Universidad de Illinois en Urbana-Champaign; Praveen Kumar, Ingeniería Civil y ambiental, Universidad de Illinois en Urbana-Champaign; Michael Dietze, Departamento de tierra y medio ambiente, Universidad de Boston.
Referencias
- ^ a b c d e "Perro marrón". NCSA marrón perro. 31 de julio 2014.
- ^ "DataUp — conservación de datos para la cola larga de la ciencia". Microsoft Research conexiones Blog. Microsoft Research conexiones equipo. 7 de agosto 2014.
- ^ Woodie, Alex. "Proyecto NCSA pretende crear un servicio de DNS-como para los datos". datanami. 7 de agosto 2014.
- ^ Pletzen, John. "U de I investigadores llegar a millones de 'súper chucho' a olfatear datos grandes tendencias". Chicago Business. Crain Communications, Inc.. 7 de agosto 2014.
- ^ Jewett, Barbara. "CONJUNTO DE DATOS LIBRE". Revista acceso NCSA. NCSA. 7 de agosto 2014.
- ^ "BU científico, colaboradores a Grant $ 10,5 millones para desarrollar Software para datos sin curaduría". https://www.Newswise.com. Boston University College of Arts and Sciences. 7 de agosto 2014.
- ^ "Premio #1261582 - CIF21 DIBBs: perro marrón". https://NSF.gov. 31 de julio 2014.
Enlaces externos
- Perro marrón -sitio oficial