Spamdexing

Ir a: navegación, búsqueda de
Para spam de Copro, vea Copro:spam y Copro:WikiProject Spam.

En Computación, Spamdexing (también conocido como spam de motor de búsqueda, Intoxicación con el motor de búsqueda, Black-Hat SEO, búsqueda spam o spam Web)[1] es la manipulación deliberada de motor de búsqueda índices. Se trata de una serie de métodos, como la repetición de frases sin relación, para manipular la relevancia o importancia de los recursos indexadas de manera inconsistente con el propósito del sistema de indexación.[2][3] Se podría considerar para ser parte de optimización del search engine, aunque hay muchos los métodos para motor búsqueda optimización que mejoran la calidad y el aspecto del contenido de sitios web y servir contenido útil para muchos usuarios.[4] Los motores de búsqueda utilizan una variedad de algoritmos para determinar la clasificación de importancia. Algunos de éstos incluyen determinar si el término de búsqueda aparece en el cuerpo del texto o URL de un Página Web. Muchos busquen motores comprobar casos de spamdexing y eliminar páginas sospechosas de sus índices. También, personas que trabajan para la organización de un motor de búsqueda pueden bloquear rápidamente los resultados-listado de sitios web que usan spamdexing, tal vez alertado por quejas de usuarios de falsa acerca de los partidos. El ascenso de spamdexing en los mid-1990s hicieron los principales buscadores de la época menos útil. Utilizando métodos poco éticos hacer rango de sitios más alto en los resultados del motor de búsqueda que lo harían si no es comúnmente en la industria SEO (Search Engine Optimization) como "Black Hat SEO".[5]

Técnicas de spamdexing comunes se pueden clasificar en dos grandes clases: contenido spam[4] (o spam de término) y enlace spam.[3]

Contenido

  • 1 Historia
  • 2 Contenido spam
    • 2.1 Relleno de palabras clave
    • 2.2 Texto oculto o invisible
    • 2.3 Relleno de meta-tag
    • 2.4 Páginas de entrada
    • 2.5 Sitios de raspador
    • 2.6 Artículo spinning
    • 2.7 Traducción automática
    • 2.8 Páginas con ninguna información relacionada con el título de página
  • 3 Enlace spam
    • 3.1 Linkbuilding software
    • 3.2 Granjas de enlace
    • 3.3 Enlaces ocultos
    • 3.4 Ataque de Sybil
    • 3.5 Blogs de spam
    • 3.6 Spam blog invitado
    • 3.7 Página de secuestro
    • 3.8 Compra expiró dominios
    • 3.9 Relleno de galleta
    • 3.10 Mediante escritura pública páginas
      • 3.10.1 Spam en blogs
      • 3.10.2 Comentarios spam
      • 3.10.3 Wiki spam
      • 3.10.4 Referrer log spamming
  • 4 Otros tipos de spamdexing
    • 4.1 Sitios web de espejo
    • 4.2 Redirección de URL
    • 4.3 Camuflaje
  • 5 Véase también
  • 6 Referencias
  • 7 Enlaces externos
    • 7.1 A páginas del informe spamdexed
    • 7.2 Páginas de ayuda de motor de búsqueda para webmasters
    • 7.3 Otras herramientas e información para webmasters

Historia

La referencia más temprana conocida[2] al término de la Spamdexing es por Eric Convey en su artículo "porno se cuela camino nuevo en la Web" El Boston Herald, 22 de mayo de 1996, donde dijo:

El problema surge cuando los operadores de sitios de carga sus páginas Web con cientos de términos extraños para que los motores de búsqueda les mostrará entre direcciones legítimas. El proceso se denomina "spamdexing", una combinación de spam — el término Internet para enviar información no solicitada de usuarios — y "indexación." [2]

Spamdexing es la práctica de spam de motor de búsqueda. Es una forma de Search Engine Optimization Spam (SEO), que es el arte de hacer un sitio web atractivo para los principales buscadores para indexación óptima. Spamdexing es la práctica de crear sitios web que se indexará ilegítimamente con una alta posición en los motores de búsqueda. Spamdexing se utiliza a veces para tratar de manipular la comprensión de un motor de búsqueda de una categoría. La meta de un diseñador web es crear una página web que se encuentra favorables rankings en los motores de búsqueda, y crean sus páginas según las normas que creen ayudará. Algunos de ellos recurren a spamdexing, a menudo sin conocimiento de sus clientes.

Mientras spamdexing ha interferido con la búsqueda de información en internet, se han tomado medidas para controlarlo con un cierto éxito. Spamdexing fue un gran problema en la década de 1990, y motores de búsqueda eran casi inútiles porque ellos fueron descubiertos por spamdexing. Una vez que Google entró en escena, todo eso cambió – Google desarrolló un ranking de página sistema que luchó contra el spamdexing bastante bien, descontando los sitios spam y otorgar cierto, relevante sitios web con clasificaciones páginas de alta.

Contenido spam

Estas técnicas implican alterar la vista lógica que tiene un motor de búsqueda sobre el contenido de la página. Todos ellos tienen como objetivo a las variantes de la modelo de espacio vectorial para la recuperación de información en colecciones de texto.

Relleno de palabras clave

Palabra clave de relleno consiste en la colocación calculada de palabras clave dentro de una página para elevar el conteo de palabras clave, variedad y densidad de la página. Esto es útil para hacer una página parecen ser relevantes para un rastreador web de manera que lo hace más probable que se encuentre. Ejemplo: Un promotor de una Esquema Ponzi ¿quiere atraer a los internautas a un sitio donde anuncia su estafa.[6] Coloca texto oculto apropiado para una página de fans de un grupo de música popular en su página, esperando que la página se mostrará como un sitio de fans y recibir muchas visitas de amantes de la música. Versiones anteriores de indexación programas simplemente contaron cuantas veces aparecía una palabra clave y utiliza para determinar los niveles de relevancia. Motores de búsqueda más modernos tienen la capacidad de analizar una página para relleno de palabras clave y determinar si la frecuencia es consistente con otros sitios creados específicamente para atraer tráfico de motor de búsqueda. Además, grandes páginas web se truncan, así enorme diccionario listas no pueden ser indexadas en una sola página web.

Texto oculto o invisible

No relacionado texto oculto se disfraza por lo que es del mismo color que el fondo, usando un tamaño de fuente pequeña o escondiendo dentro de HTML código como secciones "sin marco", todos los atributos ALT, tamaño 0 Divy las secciones "no script". Inspección de sitios web para una empresa de motores de búsqueda de personas podrían bloquear temporalmente o permanentemente una pagina entera por tener texto invisible en algunas de sus páginas. Sin embargo, texto oculto no es siempre spamdexing: también puede ser utilizado para mejorar accesibilidad.

Relleno de meta-tag

Se trata de repetir palabras clave en el etiquetas metay el uso de palabras clave meta que no está relacionados con el contenido del sitio. Esta táctica ha sido ineficaz desde 2005.

Páginas de entrada

"Gateway" o páginas de entrada son de baja calidad páginas web creadas con muy poco contenido, pero en cambio se rellenan con palabras clave y frases muy similares. Se diseñan para alinean altamente dentro de los resultados de la búsqueda, pero no sirven a los visitantes que buscan información. Una página de entrada generalmente tendrá "haga clic aquí para entrar" en la página. En 2006, Google derrocado BMW para el uso "doorway pages" BMW.de el sitio alemán de la empresa.[7]

Sitios de raspador

Sitios de raspador se crean mediante varios programas diseñados para "raspar" páginas de resultados del motor de búsqueda u otras fuentes de contenido y crear "contenido" de un sitio Web.[citación necesitada] La presentación específica del contenido de estos sitios es única, pero es sólo una amalgama de contenido tomado de otras fuentes, a menudo sin permiso. Dichos sitios web está generalmente lleno de publicidad (tales como Pay-per-click anuncios), o redireccionen al usuario a otros sitios. Es incluso posible para sitios de raspador para rango original sitios web para sus propios nombres de información y organización.

Artículo spinning

Artículo spinning consiste en reescribir los artículos existentes, en lugar de simplemente raspando el contenido de otros sitios, para evitar las multas impuestas por los motores de búsqueda para contenido duplicado. Este proceso es realizado por contratar escritores o automatizado usando un Tesauro base de datos o un red neuronal.

Traducción automática

De manera similar a giro de artículo, algunos sitios utilizan la traducción automática para representar su contenido en varios idiomas, con ninguna edición humana, resultando en textos ininteligibles.

Páginas con ninguna información relacionada con el título de página

Publicar páginas web que contienen información que no esté relacionado con el título es una práctica engañosa conocida como engaño. A pesar de ser un objetivo para las penas de los principales motores de búsqueda que alinean páginas, el engaño es una práctica común en algunos tipos de sitios web, incluyendo sitios de diccionario y enciclopedia. La búsqueda para "No pudimos encontrar la frase completa que estaba buscando"[aclaración necesitado] en Google muestra resultados 13 millones[citación necesitada] de wordreference.com. Así que aunque la página indica que no hay ninguna información acerca de la frase completa, es la información más importante en el título de la página, antes de cualquier otra cosa.

Enlace spam

Enlace spam se define como enlaces entre las páginas que están presentes por razones distintas al mérito.[8] Enlace spam toma ventaja de los algoritmos de clasificación basada en vínculos, que da sitios web más altos Escalafones de los otros sitios altamente ordenados enlace a él. Estas técnicas también tienen como objetivo influir en otras técnicas de clasificación basada en vínculos tales como la Algoritmo HITS. Hay muchos tipos diferentes de spam de enlace, construido para ambos efectos positivos y negativos de la clasificación en los sitios Web.[9] (Véase SEO negativo).

Linkbuilding software

Una forma común de enlace spam es el uso de link-building software para automatizar la optimización del search engine proceso.

Granjas de enlace

Granjas de enlace son comunidades fuertemente Unidos de páginas mutuamente, también conocido jocosamente como referencia sociedades de admiración mutua.[10] Uso de las granjas de enlaces se ha reducido considerablemente después de que Google lanzó la actualización Panda en febrero de 2011, logrando mejoras significativas en su algoritmo para detectar enlace granjas significadas al ranking de juego.

Enlaces ocultos

Poner hipervínculos donde los visitantes no verán aumentar Popularidad de enlace. Enlace resaltado de texto puede ayudar a clasificar una página web mayor para igualar esa frase.

Ataque de Sybil

A Ataque de Sybil la falsificación de identidades múltiples por mala intención, es el nombre de la famosa trastorno de personalidad múltiple paciente"Sybil". Un spammer puede crear múltiples sitios web en diferentes nombres de dominio que todo vínculo mutuamente, como los blogs falsos (conocidos como blogs de spam).

Blogs de spam

Blogs de spam se crearon blogs únicamente para la promoción comercial y la aprobación de la autoridad de enlace a sitios de destino. A menudo estos "splogs" están diseñados de manera engañosa que dará el efecto de un sitio web legítimo, pero después de una inspección cercana a menudo se escribirá mediante giro software o contenido muy mal escrito y apenas legible. Son similares en su naturaleza para vincular las granjas.

Spam blog invitado

Guest blog spam es el proceso de colocación blogs comentarios sobre sitios web con el único propósito de obtener un enlace a otra página web o sitios Web. Lamentablemente a menudo se confunde con formas legítimas de blogueo invitado con otros motivos que colocar enlaces. Hecho famoso por Matt Cutts declarando públicamente la "guerra" contra este método de spam de enlace.[11]

Página de secuestro

Página de secuestro se logra mediante la creación de una copia de pícaro de un popular sitio web que muestra contenido similar al original a un rastreador web pero redirige los internautas a sitios web malicioso o sin relación.

Compra expiró dominios

Vea también: Domaining

Algunos spammers enlace supervisan los registros de DNS para dominios que hará caducar, luego comprarlos cuando expiran y reemplazar las páginas con enlaces a sus páginas. Sin embargo, Google restablece los datos del enlace en dominios expirados. Para mantener todos los datos de ranking de Google anteriores para el dominio, es recomendable que un comprador agarra el dominio antes de que se "cae". Algunas de estas técnicas pueden aplicarse para la creación de un Bomba de Google — es decir, cooperar con otros usuarios para aumentar el ranking de una página en particular para una consulta particular.

Relleno de galleta

Relleno de galleta consiste en colocar un afiliado seguimiento de cookie en el ordenador del visitante de un sitio web sin su conocimiento, que luego generará ingresos para la persona que realiza el relleno de galleta. Esto no sólo genera ventas fraudulentas afiliados, pero también tiene el potencial para sobrescribir las cookies de otros afiliados, esencialmente robando sus comisiones legítimamente ganados.

Mediante escritura pública páginas

Artículo principal: spam del Foro

Sitios web que pueden ser editados por los usuarios puede utilizarse por spamdexers para insertar enlaces a sitios de spam si no se toman las medidas anti-spam.

Automatizado spam puede rápidamente inutilizar la porción editable por usuario de un sitio Web. Los programadores han desarrollado una variedad de automatizado técnicas de prevención de spam para bloquear o al menos más despacio spambots.

Spam en blogs

Spam en blogs es la colocación o solicitación de enlaces al azar en otros sitios, colocar una palabra clave deseada en el texto del enlace entrantes con hipervínculos. Libros de visitas, foros, blogs y cualquier sitio que acepta comentarios de los visitantes son objetivos particulares y son a menudo víctimas de tiroteo spam donde software automatizado crea puestos de tonterías con enlaces suelen ser irrelevantes y no deseados. Muchos de los blogs como Wordpress o Blogger, hacer su comentarios secciones nofollow por defecto debido a preocupaciones sobre spam.[citación necesitada]

Comentarios spam

Comentarios spam es una forma de spam de vínculo que ha surgido en páginas web que permiten editar usuario dinámicas tales como wikis, Blogs, y libros de visitas. Puede ser problemático porque agentes puede escribirse que automáticamente al azar Seleccione un usuario editando página web, como un artículo de Copro y añadir enlaces "spamming".[12]

Wiki spam

Wiki spam es una forma de spam de enlace en las páginas wiki. El spammer utiliza su editabilidad abierto wiki sistemas para colocar enlaces desde el sitio wiki a la página de spam. El tema del sitio spam es a menudo relacionado con la página wiki donde se agrega el enlace. A principios de 2005, Copro implementado por defecto"nofollow"valor para el atributo"rel"HTML. Enlaces con este atributo son ignorados por Google PageRank algoritmo. Los administradores del Foro y un Wiki pueden utilizar éstos para desalentar la Wiki spam.

Referrer log spamming

Spam referente tiene lugar cuando un agresor spam o facilitador accede a un Página Web (el árbitro), siguiendo un enlace desde otra página web (el referente), por lo que el árbitro se da la dirección del remitente por navegador de Internet de la persona. Algunos sitios web tener un referente sesión que muestra las páginas un enlace a ese sitio. Por tener una robot acceso al azar muchos sitios muchas veces, con un mensaje o una dirección específica dada como el referente, ese mensaje o dirección de Internet entonces aparece en el registro referente de esos sitios que tienen referrer logs. Ya que algunos Buscadores web base de la importancia de los sitios en el número de diferentes páginas enlazan a hablarles, spam referrer logs puede aumentar el posicionamiento en la búsqueda de los sitios de los remitentes de spam. Además, los administradores del sitio que notan que las entradas del registro referente en sus registros pueden seguir el enlace de vuelta a la página referente de los remitentes de spam.

Otros tipos de spamdexing

Sitios web de espejo

A sitio espejo es el alojamiento de múltiples sitios web con contenido conceptual similar pero usando diferentes Direcciones URL. Algunos motores de búsqueda dan un rango superior a los resultados donde aparece la palabra clave ha buscado en la URL.

Redirección de URL

Redirección de URL es la toma del usuario a otra página sin su intervención, por ejemplo, utilizando Actualización de META Etiquetas, Flash, JavaScript, Java o Del lado del servidor redirige. Sin embargo, Redirección 301, o redirección permanente, no se considera como un comportamiento malintencionado.

Camuflaje

Camuflaje se refiere a cualquiera de varios medios para servir a una página para el motor de búsqueda araña es diferente a la vista por usuarios humanos. Puede ser un intento de engañar a los motores de búsqueda en relación con el contenido de un sitio web en particular. Camuflaje, sin embargo, puede también utilizarse éticamente aumentar la accesibilidad de un sitio a usuarios con discapacidades o proporcionar usuarios humanos con contenido que los buscadores no son capaces de procesar o analizar. También se utiliza para entregar contenidos basados en la ubicación de un usuario; Google se utiliza Entrega IP, una forma de camuflaje, para entregar resultados. Es otra forma de ocultación intercambio de código, es decir, se consigue optimizar una página para top ranking y luego cambiar a otra página en su lugar una vez un rango superior.

Véase también

Portal icon Portal científico de computadoras
  • Recuperación de información acusatorio
  • Web scraping
  • TrustRank
  • Índice (buscador) — Resumen de búsqueda del motor tecnología de indexación

Referencias

  1. ^ SearchEngineLand, Video explicación de Danny Sullivan de Search Engine Spam, octubre de 2008 . Obtenido de 2008-11-13.
  2. ^ a b c "Palabra Spy - spamdexing" (definición), marzo de 2003, Página Web:WordSpy-spamdexing.
  3. ^ a b Gyöngyi, Zoltán; Garcia-Molina, Héctor (2005), "Web spam taxonomía", Actas del primer taller internacional sobre acusatorio recuperación de información en la Web (AIRWeb), en la Conferencia Internacional World Wide Web 14 (WWW 2005) (MA) -14, 10 de mayo de 2005 (Sat), 2005, Nippon Convention Center (Makuhari Messe), Chiba, Japón., Nueva York, NY: ACM Press, ISBN1-59593-046-9
  4. ^ a b Ntoulas, Alexandros; Manasse, Mark; Najork, Marc; Fetterly, Dennis (2006), "Detección Spam páginas Web a través del análisis de contenido", El XV internacional World Wide Web (WWW 2006) Conferencia 23 – 26 de mayo de 2006, Edimburgo, Escocia., Nueva York, NY: ACM Press, ISBN1-59593-323-9
  5. ^ Smarty, Ann (2008-12-17). "¿Qué es BlackHat SEO? 5 definiciones". Search Engine Journal. 2012-07-05.
  6. ^ "secrets-to-keeping-your-new-email-address-spam-free". WebSpam.org. 2 de enero 2014.
  7. ^ Segal, David (2011-02-13). "Los secretos sucios de la búsqueda". El NY Times. 2012-07-03.
  8. ^ Davison, Brian (2000), "Reconociendo nepotista enlaces en la Web", AAAI-2000 Taller de Inteligencia Artificial para la búsqueda en la Web, Boston: AAAI Press, págs. 23-28
  9. ^ Enlace Guía de tipos de spam - Spam Flag
  10. ^ Buscar motores: tecnología, sociedad y negocios - Marti Hearst, 29 de agosto de 2005
  11. ^ La decadencia y caída del invitado blogging para SEO - Matt Cutts, 20 de enero de 2014
  12. ^ Mishne, Gilad; David Carmel y Ronny Lempel (2005). "Bloquear el Spam Blog con lenguaje modelo desacuerdo" (PDF). Actas del primer taller internacional sobre acusatorio recuperación de información en la Web. 2007-10-24.

Enlaces externos

A páginas del informe spamdexed

  • Encontrado en Motor de búsqueda Google resultados
  • Encontrado en Motor de búsqueda Yahoo! resultados
  • Encontrado en Spamdexed sitio web

Páginas de ayuda de motor de búsqueda para webmasters

  • De Google Página webmaster Guidelines
  • De Yahoo! Página de indexación del motor de búsqueda

Otras herramientas e información para webmasters

  • AIRWeb serie de talleres sobre acusatorio recuperación de información en la Web
  • La guía definitiva para manipulador enlaces

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=spamdexing&oldid=653864668"