Google
ha revelado el desarrollo de un algoritmo capaz de leer con excepcional exactitud los números de las calles capturadas en Street View. El problema es que al mismo tiempo logra resolver con un 99,8% de precisión los CAPTCHAs usados en la Red para evitar
bots y
spam. Esto pone en riesgo a una medida de seguridad que la propia Google utiliza con reCAPTCHA.
El
algoritmo (pdf) desarrollado conjuntamente por los equipos de Street View y reCAPTCHA lee correctamente los números completos de las calles en un 90% de los casos, llegando a un 97,84% de aciertos con dígitos aislados en condiciones ideales. Según los encargados del proyecto, este tipo de reconocimiento en fotografías suele ser un problema difícil de resolver debido a las variaciones de luz y enfoque.
Para probar el algoritmo, los chicos de Mountain View lo utilizaron sobre los textos distorsionados digitalmente que utiliza su servicio reCAPTCHA, obteniendo una sorprendente tasa de aciertos que supera a la de los usuarios humanos. Dado que el funcionamiento de los CAPTCHAs se basa en la idea de que un ordenador no es capaz de resolver el puzle, el hito del algoritmo compromete en cierta medida la barrera de seguridad para evitar automatizaciones indeseadas en Internet.
Vinay Shet, jefe del proyecto y del equipo de reCAPTCHA, escribe en el blog de Google: "Gracias a esta investigación, sabemos que basarnos exclusivamente en texto distorsionado no es suficiente. Sin embargo, es importante aclarar que identificar de forma correcta el texto en los puzles CAPTCHA no significa que reCAPTCHA en sí mismo esté roto o sea inefectivo. Al contrario, este descubrimiento nos ha ayudado a construir medidas de seguridad adicionales contra impostores en reCAPTCHA".
Shet explica que reCAPTCHA
se basa cada vez menos en los textos distorsionados para diferenciar entre humanos y máquinas. En vez de eso se utiliza un "análisis de riesgo avanzado" que tiene en cuenta la interacción completa del usuario con el puzle a descifrar.