Investigadores de Nvidia han utilizado técnicas avanzadas de aprendizaje profundo para editar y reconstruir imágenes modificadas visualmente con un gran nivel de fidelidad con respecto al material original. Este método de restauración digital permite recuperar fotografías con "agujeros" o píxeles ausentes, pero también permite eliminar secciones de una imagen y rellenar dichos espacios de forma poco apreciable.
El documento en el que es descrita la tecnología señala que generalmente las técnicas anteriores se centraban en regiones rectangulares en posición central y requieren posprocesamiento para ocultar los defectos introducidos durante la recomposición de la imagen. El método desarrollado por Nvidia, sin embargo, funciona con "agujeros" de cualquier forma, tamaño y localización. Superficialmente puede recordar al método de Google Brain para
reconstruir imágenes pixeladas, si bien los parecidos entre ambos son escasos.
La red neural desarrollada por los investigadores se ejecutó en múltiples
unidades de supercomputación Tesla V100. Para su entrenamiento los investigadores generaron 55.116 máscaras con alteraciones aleatorias y 25.000 con fines de testeo. Estas últimas se dividieron en seis categorías distintas para ajustar la verosimilitud de las reconstrucciones.
Durante la fase de entrenamiento, señala Nvidia, el sistema introduce "agujeros" en imágenes completas para que la red neural pueda aprender a reconstruir los píxeles perdidos. La fase de testeo se ejecuta introduciendo otro tipo de "agujeros" que no estaban presentes anteriormente, permitiendo a los investigadores juzgar la precisión con la que las imágenes son restauradas.
Según señala Nvidia, este método de reconstrucción digital podría ser introducido en aplicaciones de retoque para ayudar a eliminar contenidos no deseados (por ejemplo: un
photobomb) y sustituirlos con alternativas generadas mediante redes neurales, utilizando inteligencia artificial en lugar de horas de trabajo con el ratón o la tableta digitalizadora. Pero esta es solo una de sus posibilidades.
La demostración en vídeo muestra de forma bastante clara su funcionamiento, pero quienes estén interesados en saber más sobre la técnica pueden descargar desde
aquí (PDF) un
paper considerablemente más técnico.
Fuente: Nvidia