Migración de contenido
|
|
Migración de contenido es el proceso de mover información almacenada en un Sistema de gestión de contenidos web(CMS), Administración de activos digitales(DAM), Sistema de gestión documental(DMS), o sistema a un nuevo sistema basado en HTML plano. Contenido HTML plano puede acarrear archivos HTML, Active Server Pages (ASP), JavaServer Pages (JSP), PHP, o almacenada en algún tipo de contenido HTML/JavaScript basado en el sistema y puede ser contenido estático o dinámico.
Migraciones de contenido pueden resolver una serie de cuestiones que van desde:
- Consolidación de uno o más sistemas CMS en un sistema para permitir más control centralizado, gestión de contenido y mejor gestión del conocimiento e intercambio.
- La reorganización de contenidos debido a fusiones y adquisiciones para asimilar tanto contenido de los sistemas de fuente para una apariencia unificada.
- Conversión de contenido que ha crecido orgánicamente en un CMS o HTML plano y estandarizar el formato así las normas pueden ser aplicadas para una marca unificada de los contenidos.
Hay muchas maneras de acceder a los contenidos almacenados en un CMS. Dependiendo del vendedor CMS tampoco ofrecen un Interfaz de programación de aplicaciones (API), Servicios Web, reconstruyendo un registro por escrito SQL consultas, XML las exportaciones, o a través de la interfaz web.
- La API[1] requiere un desarrollador leer y comprender cómo interactúan con la fuente capa API de CMS y luego desarrollar una aplicación que extrae el contenido y lo almacena en una base de datos, archivo XML o Excel. Una vez extraído el contenido el desarrollador debe leer y entender el objetivo CMS API y desarrollar código para empujar el contenido en el nuevo sistema. Lo mismo puede decirse para los servicios Web.
- CMSs más utilizan una base de datos para almacenar y asociado contenido así si no existe ninguna API el programador SQL debe realizar ingeniería inversa, la estructura de la tabla. Una vez que la estructura es inversa diseñado, se escriben muy complejas consultas SQL para sacar todo el contenido de varias tablas en una tabla intermedia o en algún tipo de Valores separados por comas (CSV) o un archivo XML. Una vez que el desarrollador tiene los archivos o base de datos de la promotora debe leer y entender el objetivo CMS API y desarrollar código para empujar el contenido en el nuevo sistema. Lo mismo puede decirse para los servicios Web.
- Exportación XML crea archivos XML del contenido almacenado en un CMS, pero después se exportan los archivos que necesitan modificarse para adaptarse al nuevo esquema del sistema CMS blanco. Esto normalmente se hace por un desarrollador por escribir algo de código para hacer la transformación.
- Los archivos HTML, JSP, ASP, PHP u otros formatos de archivo del servidor de aplicación son los más difíciles. La estructura de archivos HTML plano se basan en la culminación de la estructura de carpetas, estructura del archivo HTML y ubicaciones de imagen. En los primeros días de migración de contenido, el desarrollador tuvo que utilizar lenguajes de programación para analizar los archivos html y guardarlo como base de datos estructurada, XML o CSV. Típicamente PERL, JAVA, C++ o C# fueron utilizados por la expresión regular capacidad de manejo. JSP, ASP, PHP, ColdFusion y otros Application Server technologies dependen generalmente del lado del servidor incluye para ayudar a simplificar el desarrollo pero hace muy difícil a migrar el contenido porque el contenido no está montado hasta que el usuario ve en su navegador web. Esto hace que es muy difícil ver los archivos y extraer el contenido de la estructura de archivos.
- Raspado de Web permite a los usuarios acceder a la mayoría del contenido directamente desde la interfaz de usuario Web. Desde una interfaz web es visual (éste es el punto de un CMS) algunos raspadores Web aprovechar la interfaz de usuario para extraer contenido y colocarlo en una estructura como una base de datos, XML o CSV los formatos. Los CMSs, presas y DMSs utilizan interfaces web para extraer el contenido de uno o varios sitios de origen es básicamente el mismo proceso. En algunos casos es posible empujar el contenido en el nuevo CMS mediante la interfaz web pero algunos CMSs usan applets de JAVA o Active X Control que no son compatibles con la mayoría raspadores de web. En ese caso el desarrollador debe leer y entender el objetivo CMS API y desarrollar código para empujar el contenido en el nuevo sistema. Lo mismo puede decirse para los servicios Web.
El flujo de migración de contenido básico
1. obtener un inventario del contenido.
2. obtener un inventario del contenido binario como imágenes, archivos PDF, archivos CSS, oficina Docs, Flash y objetos binarios.
3. encuentre los enlaces rotos en los recursos de contenido o contenidos.
4. determinar la estructura del menú del contenido.
5. encontrar la conexión padres/hermanos con el contenido y los enlaces a otros recursos y contenido no están rotos cuando se les mueve.
6. extraer los recursos de las páginas y almacenarlos en una estructura de base de datos o archivos. Almacenar la referencia en un archivo o una base de datos.
7. Extraiga el contenido HTML de la página y almacenar localmente.
8. subir los recursos a los CMS nuevos mediante la API o la interfaz web y almacenar la nueva ubicación en una base de datos o XML.
9. transformar el código HTML para satisfacer los nuevos estándares de CMSs y vuelva a conectar todos los recursos.
10. Cargue el contenido transformado en el nuevo sistema.
Referencias
- ^ ¿Qué son las APIs de migración de contenido no
Enlaces externos
- No es una tarea pequeña: Migración de contenido a un nuevo CMS