sábado, 6 de julio de 2019

Big Data 10. Sensitivo

Big Data 10

Datos sensibles

\emph{Algunas de las informaciones registradas por gobiernos y empresas son sensibles.}

Las empresas de seguros de salud tienen informaci\'on detallada sobre los cuidados m\'edicos recibidos por sus clientes. Esta informaci\'on puede ser utilizada para importantes investigaciones sobre salud, pero si se hacen p\'ublicas pueden producir da\~{n}o emocional (p. ej., vergüenza) o da\~{n}o econ\'omico (p. ej., p\'erdida de empleo). Muchas otras fuentes de \emph{Big Data} tambi\'en mantienen informaci\'on \emph{sensitiva}, que es una de las razones por las cuales suele ser inaccesible.

Desafortunadamente, resulta ser bastante dif\'icil decidir qu\'e informaci\'on es realmente sensible (Ohm, 2015), como ejemplific\'o el Premio Netflix. En 2006 Netflix liber\'o 100 millones de calificaciones de pel\'iculas provistas por casi 500.000 miembros y abri\'o una convocatoria para que personas de todo el mundo aportaran algoritmos para mejorar las capacidades de Netflix para recomendar pel\'iculas. Antes de liberar los datos, Netflix removi\'o los datos identificadores de personas m\'as obvios, como ser los nombres. Pero apenas pasadas dos semanas de la liberaci\'on de los datos Arvind Narayanan y Vitali Shmatikov (2008) mostraron que era posible aprender sobre las calificaciones de pel\'iculas hechas por individuos utilizando algunos trucos t\'ecnicos. Incluso cuando un atacante podr\'ia descubrir calificaciones de pel\'iculas de alguna persona individual, no parece que esto sea demasiado sensible. Mientras que es as\'i en general, para al menos algunos de las 500.000 personas en el conjunto de datos, sus calificaciones son informaci\'on sensitiva. De hecho, en respuesta a la liberaci\'on y posterior re-identificaci\'on de los datos, una mujer lesbiana no declarada inici\'o acciones legales contra Netflix. As\'i se expresaba el problema en la demanda (Singel, 2009):

"Las calificaciones de pel\'iculas contienen informaci\'on... de naturaleza muy personal y sensible. Los datos sobre calificaciones de los usuarios de Netflix exponen sus intereses particulares y/o sus luchas con asuntos muy personales, incluyendo sexualidad, enfermedad mental, lucha contra el alcoholismo, y victimizaci\'on producto de incesto, abuso f\'isico, violencia dom\'estica, adulterio y violaci\'on."

Este ejemplo muestra que puede haber informaci\'on que algunas personas consideran sensitiva dentro de lo que puede parecer una base de datos benigna. M\'as a\'un, exhibe la posibilidad de que una l\'inea de defensa principal utilizada por los investigadores para proteger datos sensibles -la de-identificaci\'on- puede fracasar en maneras sorprendentes.

La recolecci\'on de datos sin el consentimiento de las personas hace surgir cuestiones \'eticas, incluso si no causan da\~{n}os espec\'ificos. As\'i como espiar a alguien que se ducha sin su consentimiento puede considerarse una violaci\'on de su privacidad, recolectar informaci\'on sensible -y recuerde lo dif\'icil que es establecer qu\'e es sensible- sin consentimiento crea potenciales cuestiones relativas a la privacidad.



No hay comentarios: