reCAPTCHA

Ir a: navegación, búsqueda de
Este artículo es sobre una implementación específica de un CAPTCHA. Para la prueba original, ver CAPTCHA.
ReCAPTCHA
RecaptchaLogo.svg
Autor (es) original Luis von Ahn, Ben Maurer, Colin McMillen, David Abraham y Manuel Blum
Desarrollador (s) Google Inc.
Estado de desarrollo Activo
Tipo Versión clásica: CAPTCHA
Nueva versión: casilla de verificación
Sitio web www.Google.com/reCAPTCHA

reCAPTCHA es un sistema de usuario-diálogo desarrollado originalmente por Luis von Ahn, Ben Maurer, Colin McMillen, David Abraham y Manuel Blum en Carnegie Mellon University principal Pittsburgh Campus y adquirido por Google en septiembre de 2009.[1] Como el CAPTCHA interfaz, reCAPTCHA pide a los usuarios introducir palabras vistos en texto distorsionado imágenes en pantalla. Presentando dos palabras tanto protege a sitios web de bots intentar acceder a áreas restringidas[2] y ayuda a digitalizar el texto de los libros.

El servicio de reCAPTCHA proporciona suscriptora sitios web con imágenes de las palabras que reconocimiento óptico de caracteres Software (OCR) ha sido incapaz de leer. Los sitios web de suscripción (cuyos fines son generalmente relacionados con el proyecto de digitalización del libro) presentan estas imágenes para los seres humanos descifrar como palabras CAPTCHA, como parte de sus procedimientos de validación normal. Luego regresan los resultados al servicio reCAPTCHA, que envía los resultados a los proyectos de digitalización.

reCAPTCHA ha completado la digitalización de los archivos de El New York Times y los libros de Libros de Google.[3] El archivo puede ser consultado desde la New York Times Artículo archivo, donde más de 13 millones de artículos en total han sido archivados, que data de 1851 hasta la actualidad.

El sistema se ha divulgado como mostrando CAPTCHAs más 100 millones cada día,[3] en sitios como Facebook, TicketMaster, Twitter, 4chan, CNN.com, StumbleUpon,[4] Craigslist (desde junio de 2008)[5] y los Estados Unidos Nacional de telecomunicaciones y administración de la informaciónes convertidor de TV digital sitio web del programa cupón (como parte de la Transición de DTV de Estados Unidos).[6]

el lema de reCAPTCHA era "Detener el spam, leer libros.",[7] hasta la introducción de una nueva versión del plugin reCAPTCHA en 2014; el lema ha desaparecido de la página web[8] y de la versión clásica del plugin reCAPTCHA.

Contenido

  • 1 Origen
  • 2 Operación
    • 2.1 Hay reCAPTCHA CAPTCHA
  • 3 Implementación
  • 4 Crítica
  • 5 Seguridad
  • 6 Proyectos derivados
  • 7 Trivia
  • 8 Referencias
  • 9 Enlaces externos

Origen

Correctores de pruebas distribuidos fue el primer proyecto que ofrecen su tiempo para descifrar texto escaneado que no se puede leer por OCR. Funciona con Proyecto Gutenberg digitalización de dominio público material y utiliza métodos muy diferentes de reCAPTCHA.

El programa de reCAPTCHA se originó con Guatemala científico de la computación Luis von Ahn,[9] y fue ayudado por un Beca MacArthur. Un desarrollador CAPTCHA temprano, se dio cuenta de "sin darse cuenta que había creado un sistema que estaba desperdiciando, en incrementos de 10 segundos, millones de horas de un recurso más preciado: ciclos de cerebro humano".[10]

Operación

Un ejemplo de cómo se veía en 2007, un reto de reCAPTCHA [11] que contengan las palabras "tras encontrar". Agregaron la ondulación y trazo horizontal para aumentar la dificultad de romper el CAPTCHA con un programa de computadora.

Texto escaneado es sometida a análisis por dos diferentes reconocimiento óptico de caracteres programas. Sus respectivas salidas luego están alineados entre sí mediante algoritmos estándar de cadena coincidente y en comparación a uno al otro y a un diccionario de inglés. Cualquier palabra que se descifra diferentemente por ambos programas OCR o eso no está en el diccionario de inglés está marcada como "sospechoso" y se convertirá en un CAPTCHA. Aparece la palabra sospechosa, fuera de contexto, a veces junto con una palabra de control ya conocida. Si el ser humano tipos correctamente la palabra de control, entonces la respuesta a la palabra cuestionable es aceptada como probablemente válido. Si suficientes usuarios debían escribir correctamente la palabra de control, pero incorrectamente tipo la segunda palabra que OCR no había podido reconocer, entonces la versión digital de los documentos podría terminar que contiene la palabra incorrecta. La identificación realizada por cada programa de OCR se da un valor de 0,5 puntos, y cada interpretación por un ser humano se da un punto completo. Una vez que llegue a una determinada identificación 2,5 puntos, la palabra se considera válida. Esas palabras que constantemente reciben una única identidad por jueces humanos son más adelante reciclada como palabras de control.[12] Si las tres primeras conjeturas coinciden mutuamente pero no coinciden con ninguno de los OCR, se consideran una respuesta correcta, y la palabra se convierte en una palabra de control.[13] Cuando seis usuarios rechazan una palabra antes de que se elige cualquier ortografía correcta, la palabra se descarta como ilegibles.[13]

El método reCAPTCHA original fue diseñado para mostrar las palabras cuestionables por separado, como corrección fuera de contexto, en lugar de uso, tales como dentro de una frase de 5 palabras del documento original.[14] Además, la palabra de control pueda inducir a error contexto para la segunda palabra, como una petición de "/metal//fife /" estando inscrito como "archivo de metal" debido a la conexión lógica de presentación con una herramienta metálica considerándose más común que el instrumento musical"Fife".[citación necesitada]

En 2012, reCAPTCHA comenzaron a utilizar las fotografías de números extraídos de Google Vista a la calle proyecto, además de palabras escaneadas.[15]

Hay reCAPTCHA CAPTCHA

El reCAPTCHA NoCAPTCHA

En 2013, reCAPTCHA comenzó "considerando activamente el compromiso completo del usuario con el CAPTCHA" para predecir si el usuario era un humano o un robot antes de mostrar el captcha, y presentando un captcha "considerablemente más difícil" en los casos donde tenía razones para pensar que el usuario podría ser un bot.[16]

En septiembre de 2014 reCAPTCHA comenzó a introducir un "reCAPTCHA NoCAPTCHA" que inicialmente pide a los usuarios hacer clic en una casilla de verificación para confirmar que son "no es un robot" y sólo requiere una verificación adicional en forma de texto distorsionado o una cuestión de imagen, si el análisis de "todo compromiso" del usuario con el CAPTCHA sugiere que puede ser un bot.[17]

Implementación

Las pruebas de reCAPTCHA se muestran desde el sitio central del proyecto reCAPTCHA, que suministra las palabras para ser descifrados. Esto se hace mediante un JavaScript API con el servidor haciendo una devolución de llamada a reCAPTCHA después de que se haya presentado la solicitud. El proyecto de reCAPTCHA proporciona bibliotecas para diversos lenguajes de programación y aplicaciones para facilitar este proceso. reCAPTCHA es un servicio gratuito (es decir, las imágenes CAPTCHA se proporcionan a los sitios web de forma gratuita, a cambio de asistencia con el desciframiento),[18] Pero no es el propio software de reCAPTCHA fuente abierta.[19]

Asimismo, reCAPTCHA ofrece plugins para diferentes plataformas de aplicaciones web, como ASP.NET, Rubí, o PHP, para facilitar la implementación del servicio.[20]

Crítica

El uso de reCAPTCHA ha sido etiquetado "un grave obstáculo al uso de internet" para personas con problemas de visión o discapacidades tales como dislexia por un periodista de la BBC.[21]

Andrew Munsell, establece en su artículo "Captchas son convertirse en ridículo" "un par de años atrás, no recuerdo realmente estar desconcertado por un captcha. De hecho, reCAPTCHA fue uno de los mejores sistemas que había visto. No es difícil de resolver, y parecía funcionar cuando lo usé en mi propios sitios Web. [22] Munsell pasa al estado, después de encontrarse con una serie de ininteligibles imágenes que a pesar de la restauración "y otra vez y otra vez. Los captchas eran no sólo es difícil para una computadora para leer, pero imposible para un ser humano". Munsell entonces proporciona numerosos ejemplos.

Seguridad

Un ejemplo de cómo los desafíos reCAPTCHA se presentaron en 2010, [23] que contengan las palabras "y cinceles"

El propósito principal de un CAPTCHA sistema es impedir el acceso automatizado a un sistema de programas informáticos o "bots". 14 de diciembre de 2009, Jonathan Wilkins publicó un artículo que describe las debilidades de reCAPTCHA que permitía una tasa del 18% de resolver.[24][25][26]

El 01 de agosto de 2010, Chad Houck dio una presentación para el DEF CON Conferencia 18 de las Hacking detalla un método para revertir la distorsión añadida a las imágenes que permitió a un programa de computadora determinar una respuesta válida 10% del tiempo.[27][28] El sistema reCAPTCHA fue modificado el 21 de julio de 2010, antes de hablar sobre su método Houck. Houck modificó su método a lo que describió como un CAPTCHA "más fácil" para determinar una respuesta válida 31,8% del tiempo. Houck también mencionó las defensas de seguridad en el sistema, incluyendo una alta seguridad bloqueo si una respuesta no válida es dado 32 veces en una fila.[29]

El 26 de mayo de 2012, Adam, C-P y Jeffball de DC949 dieron una presentación en la Conferencia de hacker LayerOne detallando cómo eran capaces de lograr una solución automatizada con una tasa de exactitud de 99,1%.[30] Su táctica era utilizar técnicas de aprendizaje, un subcampo de la inteligencia artificial, la máquina para analizar la versión en audio de reCAPTCHA que está disponible para los invidentes. Google lanzó una nueva versión de reCAPTCHA apenas unas horas antes de su charla, hacer cambios importantes en las versiones visuales y de audio de su servicio. En esta versión, la versión audio fue aumentada en longitud de 8 segundos a 30 segundos y es mucho más difícil de entender, tanto para los seres humanos, así como los bots. En respuesta a esta actualización y la siguiente, los miembros de DC949 lanzó dos versiones más de Stiltwalker que vencer reCAPTCHA con una precisión de 60.95% y 59,4% respectivamente. Después de cada descanso sucesivo, Google actualizó reCAPTCHA en pocos días. Según DC949, revirtió a menudo a las características que previamente habían sido hackeadas.

En una presentación de agosto de 2012 en BsidesLV 2012, DC949 había llamado la última versión "insondablemente imposible para los seres humanos" - no fueron capaces de resolverlos manualmente tampoco.[30] La organización de accesibilidad web WebAIM informó en mayo de 2012, "Sobre el 90% de los encuestados [usuarios de lectores de pantalla] encontrar CAPTCHA para ser muy o algo difícil".[31]

El 27 de junio de 2012, Claudia Cruz, Fernando Uceda y Leobardo Reyes (un grupo de estudiantes de México) publicaron un documento mostrando un sistema que ejecuta en reCAPTCHA imágenes con una precisión de 82%.[32] Los autores no han dicho si su sistema puede resolver imágenes recientes de reCAPTCHA, aunque dicen que su trabajo para ser OCR inteligente robusto y a algunos cambios.[aclaración necesitado]

reCAPTCHA con frecuencia modifica su sistema, requiriendo a los hackers actualizar con frecuencia sus métodos de decodificación, que pueden frustrar los abusadores potenciales.[citación necesitada]

Se utilizan sólo palabras que ambos programas OCR fallaron en reconocer como palabras de control. Por lo tanto, cualquier programa que puede reconocer estas palabras con probabilidad nonnegligible representaría una mejora sobre programas de OCR de vanguardia.[13]

Proyectos derivados

reCAPTCHA también había creado el proyecto Mailhide, que protege direcciones de correo electrónico en las páginas web de ser cosechadas por spammers.[33] De forma predeterminada, la dirección de correo electrónico se convierte en un formato que no permite una correa eslabonada para ver la dirección de correo electrónico completa; por ejemplo, "mailme@example.com" se convertirían en "mai...@example.com". El visitante que haga clic en el "..." y resolver el CAPTCHA para obtener la dirección de correo electrónico completa. Uno también puede editar el código local para que nada de la dirección es visible.

Trivia

El día de los enamorados (14 de febrero), 2015, palabra de reCaptcha CAPTCHAs muestra frases y palabras relacionadas con el amor.

Referencias

  1. ^ "Enseñanza de computadoras para leer: Google adquiere reCAPTCHA". Google. 2009-09-16.
  2. ^ Luis von Ahn, Ben Maurer, Colin McMillen, David Abraham y Manuel Blum (2008). "reCAPTCHA: reconocimiento de caracteres basado en humanos mediante las medidas de seguridad Web" (PDF). Ciencia 321 (5895): 1465-1468. Bibcode:2008Sci...321.1465V. Doi:10.1126/science.1160379. PMID18703711.
  3. ^ a b "reCAPTCHA FAQ". Google. 2011-06-12.
  4. ^ Rubens, Paul (2007-10-02). "Arma Spam ayuda a preservar los libros". BBC.
  5. ^ "Luchar contra el Spam, digitalización de libros". Blog de Craigslist. Junio de 2008.
  6. ^ Programa de caja convertidora de TV
  7. ^ "reCAPTCHA: detener el Spam, leer libros". Google. 2013-07-10.
  8. ^ "recaptcha". Google. 2015-01-03.
  9. ^ ""Entrevista completa: Luis von Ahn en Duolingo ", chispa, noviembre 2011". Canadian Broadcasting Corporation. 30 / 11 / 2011. 2013-07-10.
  10. ^ Hutchinson, Alex (marzo de 2009). "Recursos humanos: el trabajo no sabías que tenías". La morsa. págs. 15 – 16.
  11. ^ https://TechCrunch.com/2007/09/16/reCAPTCHA-using-captchas-to-Digitize-Books/
  12. ^ Timmer, John (2008-08-14). ¿"Trabajo de CAPTCHAs? para digitalización viejo, dañado textos manuscritos". Ars Technica. 2008-12-09.
  13. ^ a b c Luis; Maurer, Ben; McMillen, Colin; Abraham, David; Blum, Manuel (2008). "reCAPTCHA: reconocimiento de caracteres basado en humanos mediante las medidas de seguridad Web"(PDF)". Ciencia 321 (5895): 1465-1468. Doi:10.1126/science.1160379. PMID18703711.
  14. ^ ""dudosa validez de los resultados si se presentan palabras fuera de contexto", grupos de Google, 29 de agosto de 2008". Google. 2013-07-10.
  15. ^ 29 de marzo de 2012 (29 / 03 / 2012). "Ahora Google usando ReCAPTCHA para descodificar direcciones de vista a la calle". TechCrunch. 2013-07-10.
  16. ^ https://googleonlinesecurity.blogspot.co.uk/2013/10/reCAPTCHA-just-got-easier-but-only-if.html
  17. ^ "Cómo Google está haciendo reCAPTCHA Simpler". Forbes. 11 de diciembre 2014.
  18. ^ "PREGUNTAS FRECUENTES". reCAPTCHA.net.
  19. ^ "reCAPTCHA: detener el Spam, leer libros". Google. 14 / 01 / 2014.
  20. ^ "Guía del desarrollador - reCAPTCHA — los desarrolladores de Google". Google. 14 / 01 / 2014.
  21. ^ "Noticias de BBC - la evolución de esas molestas pruebas de seguridad en línea". BBC.com. 22 / 09 / 2014.
  22. ^ "Captchas estan haciendo el ridículo | Andrew Munsell". andrewmunsell.com. 22 / 09 / 2014.
  23. ^ https://www.Forbes.com/sites/Firewall/2010/06/18/those-scrambled-Word-tests-for-stopping-spambots-are-Tough-for-Humans-too/
  24. ^ "Directrices de CAPTCHA fuerte".
  25. ^ "ReCAPTCHA de Google fue arrestado por el nuevo ataque".
  26. ^ "Abollado reCAPTCHA de Google".
  27. ^ "Def Con 18 altavoces". DEFCON.org.
  28. ^ "Descodificación de reCAPTCHA papel". Chad Houck.
  29. ^ "Descodificación de reCAPTCHA Power Point". Chad Houck.
  30. ^ a b "Proyecto Stiltwalker".
  31. ^ "Usuario de lector de pantalla #4 resultados de encuestas".
  32. ^ Claudia Cruz-Perez; Oleg Starostenko; Fernando Uceda-Ponga; Vicente Alarcón-Aquino; Leobardo Reyes-Cabrera (30 de junio de 2012). "Rompiendo reCAPTCHAs con colapso impredecible: segmentación de carácter heurístico y reconocimiento". En Carrasco-Ochoa, Jesús Ariel; Trinidad Martínez, José Francisco; Olvera López, José Arturo; Boyer, Kim L. Reconocimiento de patrones. Lecture Notes in Computer Science 7329. México. págs. 155-165. Doi:10.1007/978-3-642-31149-9_16. ISBN978-3-642-31148-2.
  33. ^ "Mailhide: libre de protección contra el Spam". reCAPTCHA.net.

Enlaces externos

  • Sitio web oficial
  • ReCAPTCHA: El trabajo que no sabías que tenías Artículo de dos páginas en La morsa revista
  • Luis; Maurer, Benjamín; McMillen, Colin; Abraham, David; Blum, Manuel (2008). "reCAPTCHA: reconocimiento de caracteres basado en humanos vía Web las medidas de seguridad". Ciencia 321 (5895): 1465-1468. Doi:10.1126/science.1160379. PMID18703711.
  • "Luis von Ahn: colaboración en línea de gran escala", Video de YouTube del canal "Tomás", cargado de 2011-12-06.
  • Luis von Ahn en TED
  • Ejemplo de un riesgo inesperado en el uso de reCAPTCHA

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=reCAPTCHA&oldid=655527693"