
Estás a punto de comprar algo por internet o de “autentificarte” en algún servicio y aparece un cuadro de diálogo con texto un tanto indescifrable para que lo descifres y transcribas. Yo pensaba que esos textos eran creados por algún algoritmo que modificaba la estructura del texto para hacerlo o intentar hacerlo no descifrable a los “bots” pero medianamente legible para el usuario.
Resulta que esta no es la historia correcta. En realidad, según se publicó la semana pasada en la revista Science, lo que se está descifrando son fragmentos de libros y periódicos antiguos para poder ser publicados digitalmente. Esto, según publicó Luis von Ahn de la Universidad de Carnegie Mellon en Pittsburgh, no puede ser realizado por algoritmos y se requiere de un ser humano que lo haga por ellos.
Existen proyectos de restauración de documentos basados en OCR’s o reconocedores de caracteres ópticos, pero en muchos casos hay fragmentos de los textos que resultan ilegibles para el software y cuesta mucho dinero, tiempo y esfuerzo tener un ejército de humanos descifrando manualmente las piezas faltantes.
Actualmente hay más de 40,000 sitios en la web que usan el servicio llamado reCAPTCHA que permite que los usuarios ayuden a restaurar estos documentos. Facebook es uno de los sitios encontrados en el listado.
Seguramente algún día la tecnología podrá cubrir estos espacios, pero por ahora… ya sabes lo que “en realidad” haces al autentificarte en un servicio además de probar que eres un usuario y no un bot.
Fuente: Scientific American







on Oct 27th, 2008 at 21:57
[…] Pueden encontrar el post con el detalle de esto aquí. […]