Incluso cuando los nombres reales y otra información personal se elimina del big data, es posible identificar a una persona analizando sus hábitos de compra. Eso es lo que ha demostrado un grupo de investigadores del Media Lab del Instituto Tecnológico de Massachusetts (MIT) con un estudio publicado en un especial sobre la privacidad de la revista Science.
Para lograrlo, un grupo de científicos analizó las transacciones (proporcionadas por gran banco de un país de la OCDE) con tarjetas de crédito realizadas por 1,1 millones de personas en 10.000 tiendas durante un periodo de tres meses. El conjunto de datos incluye detalles como la fecha de cada transacción, la cantidad cargada y el nombre de la tienda, pero no datos personales como nombres y número de cuentas.
"Con un promedio de cuatro transacciones, el día y la tienda, basta para identificar de forma exclusiva a las personas en el 90% de los casos", dice el investigador del MIT y coautor de la investigación, Yves-Alexandre de Montjoye. "La lógica que subyace en esto reside en que muchas personas compran algo en una determinada tienda (Mango, por ejemplo) un día determinado (pongamos, ayer)”.
“Sin embargo, solo algunas de ellas también comprarán en determinado H&M ese mismo día. Y aún menos irán a comer al día siguiente en la misma zona. En cuanto sepas cuatro lugares o tiendas y días, el 90% de las veces hay una y solo una persona en toda la base de datos que compra algo en cuatro lugares en esos cuatro días", explica Yves-Alexandre.
Bien utilizados los análisis de los datos masivos (o big data) pueden detallar el comportamiento de la gente, información con potencial para mejorar la salud pública, la planificación urbana o la educación. Sin embargo, el estudio pone en tela de juicio los métodos que muchas empresas, hospitales y agencias gubernamentales utilizan actualmente para anonimizar sus registros.
Para lograrlo, un grupo de científicos analizó las transacciones (proporcionadas por gran banco de un país de la OCDE) con tarjetas de crédito realizadas por 1,1 millones de personas en 10.000 tiendas durante un periodo de tres meses. El conjunto de datos incluye detalles como la fecha de cada transacción, la cantidad cargada y el nombre de la tienda, pero no datos personales como nombres y número de cuentas.
"Con un promedio de cuatro transacciones, el día y la tienda, basta para identificar de forma exclusiva a las personas en el 90% de los casos", dice el investigador del MIT y coautor de la investigación, Yves-Alexandre de Montjoye. "La lógica que subyace en esto reside en que muchas personas compran algo en una determinada tienda (Mango, por ejemplo) un día determinado (pongamos, ayer)”.
“Sin embargo, solo algunas de ellas también comprarán en determinado H&M ese mismo día. Y aún menos irán a comer al día siguiente en la misma zona. En cuanto sepas cuatro lugares o tiendas y días, el 90% de las veces hay una y solo una persona en toda la base de datos que compra algo en cuatro lugares en esos cuatro días", explica Yves-Alexandre.
Bien utilizados los análisis de los datos masivos (o big data) pueden detallar el comportamiento de la gente, información con potencial para mejorar la salud pública, la planificación urbana o la educación. Sin embargo, el estudio pone en tela de juicio los métodos que muchas empresas, hospitales y agencias gubernamentales utilizan actualmente para anonimizar sus registros.
¿Con lo que Dios piensa, vivimos en sus neuronas y nos movemos de manera similar a datos de computo?
[idea]
MATRIX
¡Qué listos estos del MIT! ¡Ahora se han dado cuenta de lo que lleva haciendo la NSA años y años!... ¿Les sonará el programa PRISM? [qmparto] [qmparto] [qmparto]
http://es.wikipedia.org/wiki/PRISM
En fin. Noticia de relleno.
Esto me hace gracia por que parece que quiere dejar patente que en un futuro bastaria con este tipo de datos para identificar a alguien en un momento concreto, cuando actualmente basta con tener el pin o directamente que la tarjeta sea nfc para que puedas replicar "Si, se realizaron esas compras, pero no fui yo, fue un amigo, familiar...."
Con lo cual esto no vale una mierda, bueno si, para saber tus habitos de consumo, pero ya ves tu, el 90% de la gente compra cerca de su casa... no hay mas.
http://es.m.wikipedia.org/wiki/Minería_de_datos
Y no, no se analizan "a pedal". Se alimenta a un sistema de inteligencia artificial como una red neuronal con un mogollón de datos con su correspondiente usuario para que aprenda. Hecho eso se le dan solo los datos y la red neuronal es capaz de decir a quién corresponden. Los primeros son un conjunto de datos y los segundos otros distintos, y el cacharro suele acertar.
Un saludo