Incluso cuando los nombres reales y otra información personal se elimina del
big data, es posible identificar a una persona analizando sus hábitos de compra. Eso es lo que ha demostrado un grupo de investigadores del Media Lab del Instituto Tecnológico de Massachusetts (MIT) con un estudio publicado en un especial sobre la privacidad de la revista Science.
Para lograrlo, un grupo de científicos analizó las transacciones (proporcionadas por gran banco de un país de la
OCDE) con tarjetas de crédito realizadas por 1,1 millones de personas en 10.000 tiendas durante un periodo de tres meses. El conjunto de datos incluye detalles como la fecha de cada transacción, la cantidad cargada y el nombre de la tienda, pero no datos personales como nombres y número de cuentas.
"Con un promedio de cuatro transacciones, el día y la tienda, basta para identificar de forma exclusiva a las personas en el 90% de los casos", dice el investigador del MIT y coautor de la investigación, Yves-Alexandre de Montjoye. "La lógica que subyace en esto reside en que muchas personas compran algo en una determinada tienda (Mango, por ejemplo) un día determinado (pongamos, ayer)”.
“Sin embargo, solo algunas de ellas también comprarán en determinado H&M ese mismo día. Y aún menos irán a comer al día siguiente en la misma zona. En cuanto sepas cuatro lugares o tiendas y días, el 90% de las veces hay una y solo una persona en toda la base de datos que compra algo en cuatro lugares en esos cuatro días", explica Yves-Alexandre.
Bien utilizados los análisis de los datos masivos (o
big data) pueden detallar el comportamiento de la gente, información con potencial para mejorar la salud pública, la planificación urbana o la educación. Sin embargo, el estudio pone en tela de juicio los métodos que muchas empresas, hospitales y agencias gubernamentales utilizan actualmente para anonimizar sus registros.