Cuatro compras con la tarjeta te pueden identificar

Benzo
17 4 27
Noticias » Internet
Incluso cuando los nombres reales y otra información personal se elimina del big data, es posible identificar a una persona analizando sus hábitos de compra. Eso es lo que ha demostrado un grupo de investigadores del Media Lab del Instituto Tecnológico de Massachusetts (MIT) con un estudio publicado en un especial sobre la privacidad de la revista Science.

Para lograrlo, un grupo de científicos analizó las transacciones (proporcionadas por gran banco de un país de la OCDE) con tarjetas de crédito realizadas por 1,1 millones de personas en 10.000 tiendas durante un periodo de tres meses. El conjunto de datos incluye detalles como la fecha de cada transacción, la cantidad cargada y el nombre de la tienda, pero no datos personales como nombres y número de cuentas.

"Con un promedio de cuatro transacciones, el día y la tienda, basta para identificar de forma exclusiva a las personas en el 90% de los casos", dice el investigador del MIT y coautor de la investigación, Yves-Alexandre de Montjoye. "La lógica que subyace en esto reside en que muchas personas compran algo en una determinada tienda (Mango, por ejemplo) un día determinado (pongamos, ayer)”.

“Sin embargo, solo algunas de ellas también comprarán en determinado H&M ese mismo día. Y aún menos irán a comer al día siguiente en la misma zona. En cuanto sepas cuatro lugares o tiendas y días, el 90% de las veces hay una y solo una persona en toda la base de datos que compra algo en cuatro lugares en esos cuatro días", explica Yves-Alexandre.

Bien utilizados los análisis de los datos masivos (o big data) pueden detallar el comportamiento de la gente, información con potencial para mejorar la salud pública, la planificación urbana o la educación. Sin embargo, el estudio pone en tela de juicio los métodos que muchas empresas, hospitales y agencias gubernamentales utilizan actualmente para anonimizar sus registros.
27 comentarios
  1. Pensando...

    ¿Con lo que Dios piensa, vivimos en sus neuronas y nos movemos de manera similar a datos de computo?

    [idea]

    MATRIX
  2. Demasiados datos volando por la nube.
  3. Ya ves...entre eso, las 25000000000 camaras que hay en cada ciudad y los moviles con todo activado, casi que nos pueden ver onlive las 24h [carcajad]
  4. Vaya coñazo analizar todos esos datos. Solo de pensarlo me aburre.
  5. Juas, juas, juas...
    ¡Qué listos estos del MIT! ¡Ahora se han dado cuenta de lo que lleva haciendo la NSA años y años!... ¿Les sonará el programa PRISM? [qmparto] [qmparto] [qmparto]

    http://es.wikipedia.org/wiki/PRISM

    En fin. Noticia de relleno.
  6. Con todo eso y los smartwatch, ya saben lo que tardamos en hacer la digestion y cuando tienen que venir a por nosotros jajajaja
  7. Es que somos gente de costumbres... no es difícil dar con uno.
  8. SI, pero jamas podras decir con seguridad "Esa persona estuvo o estara ahi..."

    Esto me hace gracia por que parece que quiere dejar patente que en un futuro bastaria con este tipo de datos para identificar a alguien en un momento concreto, cuando actualmente basta con tener el pin o directamente que la tarjeta sea nfc para que puedas replicar "Si, se realizaron esas compras, pero no fui yo, fue un amigo, familiar...."

    Con lo cual esto no vale una mierda, bueno si, para saber tus habitos de consumo, pero ya ves tu, el 90% de la gente compra cerca de su casa... no hay mas.
  9. A estas alturas ya empiezo a pensar que lo de la privacidad se acabó con internet, dan ganas de tirar la toalla, porque al final por cualquier pequeña cosa sacan toda la información que quieran por mucho que uno quiera evitarlo
  10. Big data yo lo traduciría por mineria de datos

    http://es.m.wikipedia.org/wiki/Minería_de_datos

    Y no, no se analizan "a pedal". Se alimenta a un sistema de inteligencia artificial como una red neuronal con un mogollón de datos con su correspondiente usuario para que aprenda. Hecho eso se le dan solo los datos y la red neuronal es capaz de decir a quién corresponden. Los primeros son un conjunto de datos y los segundos otros distintos, y el cacharro suele acertar.

    Un saludo
Ver más comentarios »