domingo, 24 de noviembre de 2019

No me dais vuestros datos porque soy feo...

Esa, amigo lector, es la conclusión a la que estoy llegando en las últimas semanas... Claro que dicho así no queda muy claro por qué pienso eso, así que voy a intentar contárselo desde el principio. Espero que además de mi más que posible problema estético personal acabe coincidiendo conmigo en que, como diría Obélix, "están locos estos romanos"...

Vayamos al principio, pues. Sabrá usted que llevo ya tiempo dedicando parte de mis esfuerzos a la ciencia ciudadana. Hablé en detalle de lo que es la ciencia ciudadana en este post de hace casi siete años, así que para los fines de esta historia me limitaré al caso en que los ciudadanos colaboran con la ciencia generando datos para la investigación. Esto ocurre, por ejemplo, cuando se participa en experimentos económicos, de los que tanto se habla en este blog. Pero también se pueden proporcionar datos de manera pasiva, simplemente dejando que nos monitoricen de una u otra manera. Este es el caso, por ejemplo, del famoso y polémico estudio del INE sobre movilidad, para el cuál se han tomado datos de los teléfonos móviles de muchos de ustedes (yo estoy en otra compañía) durante la semana pasada.

En el caso que nos ocupa en concreto, acabo de empezar un estudio en el cual quiero monitorizar a un grupo numeroso de gente pero que de momento está en fase de pruebas, así que con unas pocas decenas de participantes me sirve. El estudio forma parte de una de mis líneas de investigación sobre relaciones personales (aquí se puede encontrar un artículo en el que se cuenta este trabajo para todos los públicos). La idea básica es que estructuramos nuestras relaciones en círculos, comenzando por un círculo de tres, cinco personas que son íntimas, al que luego añadimos de ocho a doce más que son muy buenos amigos, luego otros 30 a 40 amigos, hasta llegar al llamado número de Dunbar, 150 relaciones más o menos estables y con cierto grado de profundidad en total. En un artículo publicado el año pasado junto con Ignacio Tamarit, José A. Cuesta y el propio Robin Dunbar demostramos que esta estructura se puede predecir matemáticamente, e incluso el propio factor aproximado de tres entre el tamaño de los círculos es consecuencia de la teoría. Aquí me voy a permitir decir que acaba de aparecer un estudio financiado por La Caixa donde Miranda Lubbers, José L. Molina y Hugo Valenzuela han visto el siguiente círculo, en torno a 400 y pico conocidos en total, en un trabajo realmente interesante que tengo que contar en algún post próximo y que confirma la estructura de círculos de Dunbar.

Pero volviendo a lo que me ocupa: como todo trabajo científico que se precie, el nuestro abre casi más preguntas de las que responde, y para abordarlas necesitamos nuevos datos, recogidos pensando en las preguntas que queremos abordar ahora. Así que pensamos que podríamos obtenerlos de los teléfonos móviles de la gente, para lo cual utilizaríamos una app que nos dejaría acceder a sus datos, fundamentalmente de movilidad y de varios tipos de contactos. Esto último seguramente le parecerá obvio, amigo lector, pero se preguntará que para qué la movilidad. La idea en ese caso es intentar correlacionar el tipo de contacto o relación con la proximidad geográfica y su duración, así que no, no lo pedimos por pedir. Total, que preparamos la app, nos cercioramos de que no consumía prácticamente recursos del móvil, y pasamos a la fase de captar sujetos para el estudio.

En esta fase, abordamos a grupos de alumnos de mi universidad y les pedimos que nos ayudaran instalándose la app. Les explicamos que los datos son totalmente anónimos (sobre esto, una digresión más abajo, aceptémoslo de momento), que solo los vamos a usar nosotros, que son para fines científicos, les dimos una hoja explicando todas y cada una de las cosas que vamos a recoger, les aclaramos que se podían desinstalar la app en cualquier momento, y nos pusimos a su disposición para cualquier pregunta adicional que tuvieran. La respuesta fue, por decirlo suavemente, tibia. A fecha de hoy no creo que hayamos logrado captar ni veinte personas. Y aquí es dónde decidí que, efectiva y definitivamente, soy feo y por eso la gente no quiere darme sus datos.

Porque, claro, me pregunto yo, qué otra explicación puede tener esta falta de participación que lo desagradable de mi presencia, sabiendo que el 99,99% de nosotros estamos regalando a un montón de empresas nuestros datos (y los de otros, como escribí en este post sobre como obtener datos de gente que no está en redes sociales usando datos de otros) para su uso primero, y para su comercialización después? Por supuesto, esto es algo que expliqué a las personas que intentábamos captar para nuestro estudio, pero no pareció impresionarles mucho. Parece que ya nos hemos acostumbrado a que Google, por decir alguien en concreto, sepa todo lo que hay que saber de nuestra movilidad y otro poco más, lo damos por hecho y ya no le damos más importancia. Pero claro, ese no es el único problema: en un estudio reciente de Julien Gamba, Mohammed Rashed, Abbas Razaghpanahz, Juan Tapiador y Narseo Vallina-Rodriguez se prueba que en nuestros teléfonos Android hay un montón de gente escuchando ¡sin pedirnos siquiera permiso! Porque vamos a ver, Google y compañía nos espían hasta los higadillos, pero en los famosos términos y condiciones que ocupan más que la Encyclopaedia Britannica y que todos aceptamos sin leer pone que lo van a hacer. Aquí estoy hablando de apps que vienen preinstaladas en nuestros Androids que ni se molestan en preguntar. Y no son pocas: hay más de cien que, como digo, vienen preinstaladas, y desde que encendemos el móvil se dedican a capturar nuestros datos y a distribuirlos a terceros, incluyendo en algunos casos acceso a los metadatos de nuestras llamadas telefónicas y/o la posibilidad de rootear  nuestro terminal y hacerse con su control. Le animo, amigo lector a que lea el estudio si quiere pasar un buen rato... de terror. Y tenga en cuenta que el estudio no se aplica a los iPhones porque no se puede acceder a sus tripas, pero como dice una amiga mía, "piensa mal... y te quedarás corto".

Viene a cuento aquí la digresión que prometí sobre anonimidad de los datos. Estuve la semana pasada en un grupo de trabajo sobre líneas de investigación prometedoras para el programa "Future and Emerging Technologies" de la Comisión Europea y una de los que me/nos pareció más interesante fue "Anonymous analytics". Es decir, ser capaces de sacarle jugo a los datos sin romper la privacidad de los usuarios. El problema es que todos los que allí estábamos coincidimos en que los datos se pueden o se podrán anonimizar... durante un cierto tiempo, pero al final alguien sabrá cómo descubrir identidades hagamos lo que hagamos. Lo más que vamos a poder prometer a la gente es que lo pondremos difícil, incluso muy difícil, pero imposible y para siempre es una quimera. Así que si alguien, incluido yo, le promete que sus datos van a estar completamente anonimizados y nunca se podrá sacar información personal de ellos, está usted más que autorizado a desternillarse en su cara.

Así que yo ni siquiera prometo eso. Prometo a mis posibles usuarios que los datos solo los voy a ver yo, que los voy a utilizar para este estudio en el que me preocupa cuantos contactos tiene HZ&%7M1 y cuánto tiempo les dedica, pero no quién es HZ&%7M1, y ya. Bueno, ya, no, porque hay otro problema: yo podría destruir los datos una vez utilizados (y entonces sí que no correrá riesgo su privacidad) pero claro, si algún amable investigador quiere revisar lo que he hecho y que no me he equivocado, no lo va a poder hacer, y eso muy científico no es, la verdad (de hecho, todos los trabajos que hacen investigadores de, por ejemplo, Facebook, con acceso a unos datos solo para ellos, me merecen bastante poca credibilidad). No solo eso, va contra el paradigma que la Comisión Europea quiere imponer desde ya de Open Science, en el que todo se comparte, y en particular los datos que uno ha usado.

Para ser sinceros, sí que puede haber explicaciones alternativas a los problemas que me encuentro, por lo que me voy a subir un poco la autoestima considerándolas. Una es el conocido efecto opt-in/opt-out, por el cual la gente tiende a asumir las opciones por defecto. Si los teléfonos vinieran con mi app instalada, alguna gente se la desinstalaría, pero muchos no se molestarían. En un ejemplo concreto en medicina (que agradezco a Antonio Cabrales), un 38% de los posibles participantes se apuntaron al experimento, mientras que un 50% permanecieron cuando para no participar había que hacer algo. Puede haber algo de este efecto, claro, pero en uno de los grupos que abordamos de unas 40 personas se apuntó 1, lo que me parece demasiado para esta explicación. Está también el hecho de que las personas pueden percibir que dan sus datos a los gigantes tecnológicos a cambio de servicios, mientras que yo se los pido a cambio de nada (gracias a mi bienamado editor Javier por esta explicación alternativa). El problema es entonces de educación, de hacer ver a la gente que no es a cambio de nada sino para el avance de la ciencia que redundará en su bienestar futuro.

Espero que la explicación de que no me estén dando los datos sea alguna como las que acabo de proponer (quizá agravadas por mi fealdad) porque se podría actuar sobre ellas para conseguir más participación. Si la ciudadanía no contribuye, muchas cosas se quedarán sin investigar porque los investigadores no tendremos acceso a datos a los que sí tiene cuanto pirata y ladrón desalmado anda suelto que no se anda con tantos remilgos y protección de privacidad como nosotros. Piense que, como ya he dicho, sus datos pueden ser imprescindibles para hacerle la vida mejor; no sé cuál es el propósito exacto del INE con la movilidad, pero si sé que si por ejemplo quiero hacer un estudio para mejorar la movilidad en una ciudad, el que una fracción apreciable de ciudadanos me deje monitorizar sus desplazamientos parece bastante imprescindible, ¿no? Por no hablar, por ejemplo, de aplicaciones que capturan datos para detectar problemas de salud... Así que termino con lo que decía al principio: todos aquellos que esperan que se resuelvan estas cosas sin aportar sus datos para la investigación, y permitiendo a la vez que todo hijo de vecino les robe su vida digital en sus narices con propósitos inconfesables, caen bajo el epígrafe de "están locos estos romanos". Si este pequeño exabrupto producto de mi frustración, paciente lector, le hace reflexionar un poco sobre todas estas contradicciones, ya habré hecho algo positivo. Que lo he contado así medio de broma, pero esto es un tema muy serio y para meditar mucho...



No hay comentarios:

Publicar un comentario