Classora
|
Este artículo Necesita referencias adicionales para verificación. (Junio de 2012) |
Classora es un base de conocimientos para el Internet orientado a datos Análisis. Desde un punto de vista práctico, Classora es una repositorio digital que las tiendas estructurado información y le permite mostrarse en múltiples formatos: analíticamente, gráficamente, geográficamente (a través de mapas); así como llevar a cabo OLAP Análisis. La información contenida en Classora proviene de fuentes públicas[1] y es cargado en el sistema a través de los bots y ETL procesos. El Base de conocimientos tiene un comercial API[2] para la mejora de la semántica y una abrir web[3] a través del cual cualquier usuario puede acceder a parte de la información recogida (también permite a los usuarios datos y compartir las opiniones completas).
Internamente, se organiza alrededor de Classora Unidades de conocimiento y Informes. Una «unidad de conocimiento» es cualquier elemento del mundo sobre el cual información podrá almacenarse y presentado en forma de una hoja de datos (una persona, empresa, país, etc..) Un «informe» es un grupo de unidades de conocimiento: un ranking de las empresas, una tabla de clasificación del deporte, una encuesta sobre la gente, etc.. De hecho, una de las capacidades técnicas de Classora es que permite la comparación de los informes y las unidades de conocimiento se reunieron de diferentes fuentes, generando un valor agregado para los medios de comunicación en la que se publica esta información: los medios digitales, televisión interactiva, etc..
Contenido
- 1 Definiciones clave
- 1.1 Unidad de conocimiento
- 1.2 Informe de datos
- 1.3 Taxonomía organizacional
- 2 Arquitectura de Classora
- 2.1 Módulo de extracción de datos
- 2.2 Módulo participativa
- 2.3 Módulo de conectividad
- 3 Estadísticas del proyecto
- 4 Enlaces externos
- 5 Referencias
Definiciones clave
Unidad de conocimiento
El unidades de conocimiento (también conocido como entradas) en Classora son las hojas de datos que ten una cierta equivalencia semántica con los artículos de la Copro: ellos almacenar información acerca de cualquier elemento del mundo, ya sea una película, un país, una empresa o un animal. Sin embargo, se diferencian de Copro en Classora almacena información estructurada, enriquecida con una capa de metadatos; y por lo tanto, es capaz de interpretar automáticamente el significado de cada unidad de conocimiento.
Informe de datos
A Informe es un grupo de unidades de conocimiento en el cual no se permite la repetición de elementos. Esta definición incluye cualquier lista, encuesta, clasificación, etc..; y, en general, cualquier consulta que involucra a más de una unidad de conocimiento. Classora sobresale en la gestión de informes debido a sus capacidades de visualización, siendo capaz de Mostrar datos en forma de tablas, gráficos y mapas.
Tipos de informes:
- Resultados deportivos:: Deportes Resultados competiciones sancionadas por la institución competente.
- Clasificaciones y listas:: Todos los tipos de listas interesantes y curiosas, si tienen una orden implícita o no.
- Encuestas:: Unidades de conocimiento que se clasifican según los votos de los usuarios.
- Consultas a la Base de conocimientos:: Preguntas de usuarios utilizando CQL.
- Redes de conexiones:: automáticamente calculada a partir de los informes y la taxonomía de cada unidad de conocimiento.
Taxonomía organizacional
Un taxonomía organizacional (también conocido como tipo de entrada) es una hoja de datos que reúne los atributos comunes de un conjunto de unidades de conocimiento. Por ejemplo, la taxonomía organizacional Piloto de F1 muestra los atributos como la fecha de debut, equipo, etc..; y la taxonomía organizacional Club de fútbol presenta atributos como ciudad, estadio, etc..
En Classora, taxonomías están organizadas jerárquicamente, por lo que heredan los atributos de las taxonomías de sus padres. Por ejemplo, Piloto de F1 es una taxonomía subsidiaria de Deportista, que es una taxonomía subsidiaria de Persona, que a su vez es una taxonomía subsidiaria de Organismo.
Es el tipo más simple de entrada en Classora Objeto Classora. Todas las taxonomías son sus filiales y heredarán sus atributos. De hecho, es el único atributo que objeto Classora posee nombre (todas las unidades de conocimiento son necesarias para tener al menos un nombre).
Arquitectura de Classora
Módulo de extracción de datos
El módulo de extracción de datos consiste en un conjunto de robots coordinado por software que gestiona también los posibles incidentes. La mayoría de la información disponible en Classora se cargan automáticamente a través de esos robots, que conectan a las fuentes públicas en línea principales para reunir todos los tipos de datos. Hay tres categorías de robots:
- Robots de extracción:: responsable de la carga masiva de informes procedentes de fuentes públicas oficiales (FIFA, CIA, FMI, Eurostat...). Son utilizados para datos absolutos o incrementales subiendo.
- Robots de analizador de datos:: responsable de buscar y actualizar los datos de una unidad de conocimiento. Usan fuentes específicas para realizar esta tarea: Copro, IMDB, Banco Mundial, etc..
- Agregadores de contenido:: no conectan a fuentes externas. Por el contrario, generan nuevas informaciones utilizando la base de datos interna de Classora.
Módulo participativa
En Open Web de Classora, los usuarios de Internet podrán participar aportando sus conocimientos como lo harían en la Copro. Hay diferentes maneras de participar: agregar o corregir datos en la Base de conocimientos, votando en las encuestas (Ranking participativo) y crear nuevas unidades de conocimiento y los informes de datos.
Módulo de conectividad
La Base de conocimientos está diseñado para ser integrado en sistemas multiplataformas, multicanal, permitiendo su integración en dispositivos móviles, tabletas, TV interactiva, etc.. Esta integración puede realizarse a través de plugins específicos (para navegantes u otros dispositivos) o un API RESTO proporciona contenido en XML o JSON formatos. La API está dividida en tres bloques de operaciones. El primero es el bloque de herramientas de utilidad general (desde autosuggest componentes sobre las jerarquías geográficas a las operaciones para obtener la lista de los cumpleaños de celebridades de hoy, utilizando CQL). El segundo es el bloque de operaciones para la generación de widget (gráficos, mapas, clasificaciones) utilizando la información de la base de conocimientos. Por último, hay un bloque de operaciones diseñadas para la publicación de contenidos de código libre.[4]
Estadísticas del proyecto
A partir de abril de 2012, 2.000.000 unidades de conocimiento, 15.000 informes, alrededor de 10.000 mapas y varios millones potenciales análisis comparativo habían añadidos a Classora. Según el sitio de métricas web Alexa, web abierta de Classora clasificado en 100.557 a nivel mundial y en 2.880 en el ranking de tráfico.[5] Los usuarios gastan un promedio de 9 1½ minutos en Classora.
Enlaces externos
- Web abierta de Classora Knowledge Base
Referencias
- ^ Entrevista en la revista tecnológica R (Español)
- ^ Classora API en Weblog oficial
- ^ Web abierta de Classora Knowledge Base
- ^ Post sobre API en Classora weblog oficial
- ^ Alexa métricas de Classora Open Web