Capturar y almacenar: los desafíos para cuidar nuestros datos

Sebastián Davidovsky

Datos para convertirlos en información relevante. Que puedan servir para construir una política pública basada en las necesidades. Datos para entender qué es lo que quiere la gente, qué es lo que está entre sus prioridades. Datos censales: cuántos viven en un hogar, cómo, tienen prepaga, no la tienen, ¿cantidad de habitaciones? Los datos se contraponen a la intuición: una cosa es lo que veo, otra lo que existe y puede ser cotejado. La promesa permanente.

A lo largo del tiempo, los Estados fueron perfeccionando la forma de captar esos datos. Fue con el sistema de tarjetas perforadas (uno de los primeros sistemas computacionales) que los Estados Unidos pudieron mejorar y optimizar el sistema censal en 1890. Fue apenas el principio de una necesidad que fue aumentando con el tiempo y el desarrollo de las ciudades. ¿Cómo hacer para capturar mejor la información de los ciudadanos y almacenarla de forma masiva?

La aceleración se produjo a partir de la digitalización. Recién en mayo de 1995 empezaron en la Argentina las primeras conexiones comerciales a Internet. En 1998 había 230.000 usuarios. A principios de 2000, ya eran más de 2 millones. La primera década de este siglo combinó la revolución de la llegada masiva de notebooks
junto con el desarrollo de smartphones y la conectividad permanente. Hoy ya hay 11 millones de hogares usuarios de Internet fijo, sumado a una cobertura de casi cien por ciento de líneas móviles con datos. El acceso está.

Al mismo tiempo, cambió también la forma de relación entre los ciudadanos y los datos, que ya no son únicamente accesibles desde un lugar físico sino también desde distintos puntos externos remotos. La nube. La ventaja es esa: que esas bases de datos estén disponibles para generar consultas, comparaciones, estadísticas y demás. Y a partir de ello, facilitar trámites: desde la solicitud de un crédito bancario, que rastrea en un historial on line siempre disponible, hasta la prueba de fe de vida. Hacer interactuar a los datos. Así surgieron las especialidades asociadas más recientes, como el data science, data analytics, o data engineer. Esto no hubiera sido posible sin la digitalización y sus posibilidades de estructurar mejor esa información. Pero tanto la captura como el almacenamiento, que son dos fenómenos que no pueden disociarse en esta era, presentan un problema: ¿qué pasa cuando alguien captura más allá de lo que necesita y qué sucede cuando los que tienen acceso a ese almacenamiento son otros, y no fue previsto?

Capturar

Durante los últimos años, no fueron solo los Estados, o las entidades financieras quienes recopilaron datos. Con la masificación de las redes sociales y las tiendas de aplicaciones (que ofrecieron herramientas gratuitas a cambio de dudosos contratos de intercambio), se descentralizó fuertemente la recolección de datos. Esto ocurrió por varios motivos:

Fueron los usuarios quienes los entregaron por su propia voluntad, incluso más de lo que siempre habían entregado, como su ubicación permanente, el acceso a su registro de llamadas o imágenes, sus gustos y vínculos más cercanos.
Entregar datos se volvió más conveniente para obtener mejores resultados cotidianos. Desde búsquedas más acordes (no es lo mismo Boca Juniors que Boca Ratón) hasta sugerencias publicitarias más relevantes.
El dato se volvió, más que nunca, materia prima con posibilidad de ser convertida en información relevante, conocimiento. No se trató solo de capturar sino de convertirlo en una acción de corto, mediano o largo plazo. Te doy mi ubicación y me llevás por la mejor ruta.
El dato se convirtió en el petróleo del siglo XXI: es comercializado e intercambiado, y utilizado como combustible de grandes decisiones.
Los gobiernos se dieron cuenta de que no hacía falta que ellos mismos hicieran la vigilancia porque ya había alguien que lo estaba haciendo. Tercerizaron y gestionaron (a veces, con pedidos judiciales) esas solicitudes.

La captura de datos planteó un dilema adicional a la tensión existente entre privacidad y seguridad. Bajo el paraguas de evitar actos delictivos y de inseguridad, o seguridad nacional, se recopilan datos de miles de usuarios que pueden ser consultados fácilmente. No se investiga solamente a los acusados sino que se registran actividades de millones de ciudadanos. Por las dudas. Un ejemplo puso en evidencia esta tensión entre seguridad y privacidad: en 2019, la Ciudad de Buenos Aires implementó –a través de la Resolución 398– un Sistema de Reconocimiento Facial de Prófugos (SRFP) que opera sobre 300 cámaras de la vía pública con el objetivo de identificar personas con orden de detención de la Justicia. La idea era que se pudiera detectar a aquellas personas con orden de detención en todo el país que circulaban por la Ciudad. Para hacerlo, tomaban las imágenes de los prófugos de esa base de datos y cuando alguien, con rostro similar, aparecía en cámara caminando por la calle, se emitía una alerta. Más allá de los resultados (se involucraron causas prescriptas de una base de datos obsoleta, o se detuvo a personas no que eran las buscadas y que pasaron largas horas en comisarías), la pregunta de fondo es si correspondía vigilar millones de rostros por día para intentar detener a un número apenas mayor a 40.000 personas. Es lo que los especialistas insisten en llamar proporcionalidad. Tema recurrente en la captura. ¿Para qué? ¿No había otro método mejor? ¿Es el más adecuado?

A mediados de la década de 1930, 36 años después del censo en los Estados Unidos, el régimen nazi utilizó el mismo sistema de tarjetas perforadas para generar listas de judíos y otras víctimas a las que luego se deportaba. La tecnología ya estaba disponible, pero en las manos equivocadas. Hay un libro que lo cuenta: IBM y el Holocausto. ¿Alguien contempla hoy esa posibilidad?

Almacenar

Detrás de la captura está el almacenamiento. El lugar en el que se guardan esos datos obtenidos. El combo entre incorporación de dispositivos, digitalización y uso de servicios extendió los límites hacia nuevas fronteras a las que “viaja” esa información. Ahora, además de empresas hay también lugares lejanos, fuera del país, donde se encuentra ese gran volumen de información conocido como big data.

Un buen uso de esos datos debería tener su correlato en mejores servicios. Si fuera así, una mayor conectividad y disponibilidad de servicios on line implicaría que vivir lejos de un centro urbano ya no significaría tener menor acceso a los servicios públicos. Las herramientas digitales también pueden dar a los ciudadanos una mayor voz y participación en los procesos sociales y políticos. En la Administración Pública, el uso de tecnologías digitales tiene el potencial de hacer al Estado más efectivo, eficiente, inclusivo y transparente. Algo similar sucede en el sector privado. Ahora, ¿esto está efectivamente pasando?

La otra cuestión que se dirime en el terreno de los datos digitalizados tiene que ver con el lugar donde se almacenan los datos y cómo se protegen los mismos. Sobre lo primero, acudimos a una pérdida de control de los Estados. Si no están aquí, ¿dónde están? ¿Qué organismo puede controlarlos además de consultarlos?

Luego, están los riesgos. ¿Qué pasa si esos datos se pierden o caen en manos de terceros? En los últimos tiempos, lo sufrieron muchos: desde las empresas prestadoras de salud (que deben garantizar la privacidad y seguridad de la información de sus clientes) o incluso el propio Estado, que almacena las huellas dactilares, las direcciones, el número de trámite de DNI (llave para realizar numerosos trámites digitales) o la foto de los más de 40 millones de ciudadanos.

La acumulación de datos, presentada como conveniente y útil, para facilitar la gestión y operación, trajo consigo la propia contradicción del riesgo. Volviendo al Renaper. El sistema del Registro Nacional de las Personas es utilizado por más de 150 instituciones públicas y privadas. Entre los clientes se encuentran Migraciones, la AFIP, la ANSES, el PAMI, el Ministerio de Seguridad, el Ministerio de Transporte, el Poder Judicial, los poderes legislativos y billeteras digitales o bancos, entre otros. Por ejemplo, es la base de datos del Renaper la que valida la identidad cuando alguien se hace una cuenta en Mercado Pago, para certificar que esa persona es la que es. Durante la pandemia se habilitaron mecanismos para validar identidades de personas que daban COVID positivo o que eran vacunadas. Todo se matcheaba contra esa base. Y se registraba para, por ejemplo, no repetir la dosis en una persona.

El problema –que no es únicamente del Renaper– es qué sucede cuando esas consultas pueden ser realizadas por personas u organismos que no están habilitados para hacerlo. Es decir, cuando esos datos son accesibles por terceros sin autorización. Y peor aún: qué posibilidades hay de dar marcha atrás respecto de aquella idea optimista de gestión, en caso de que algo no funcione. Una vez que esa consulta inesperada es realizada, ¿cómo se hace para volver atrás? ¿Hay manera de hacerlo? ¿Hasta dónde puede llegar a multiplicarse aquello que no debió reproducirse? Hay preguntas en el horizonte: cómo proteger, por ejemplo, la Historia Clínica Digital, de reciente aprobación en el Congreso y tal vez la información más sensible de la ciudadanía. Una vez que se filtra, escala, y se replica, infinitamente, con costo cero.

En los últimos tiempos no solo fueron atacados organismos del Estado sino también empresas privadas con información igual de delicada de sus propios clientes. Empresas de medicina prepaga sufrieron ataques ransomware en los que se reveló no solo su información administrativa (balances contables, ingresos, egresos) sino también diagnósticos médicos y psicológicos, de laboratorio, diagnósticos por imágenes –radiografías y resonancias–, historias clínicas y audiometrías. Las empresas de seguros son las más buscadas por los delincuentes.

La dinámica se completa con una digitalización sin alternativas. No hay, al parecer, camino posible para otra cosa. Entonces cabe la pregunta de si esa opción no elegida por afiliados y clientes, aunque sí exigida desde la dinámica diaria (servicios más eficientes y sencillos, desde el celular), debería ir acompañada de un mayor resguardo de derechos y garantías sobre sus propios datos. ¿Quién va a ser el garante de este camino?

Captura y almacenamiento son parte de una digitalización sin vuelta atrás. Lo saben los políticos que miden el humor social, que nos segmentan en poblaciones, en consumos, en tipos de votante, aunque a veces con dudosos resultados. Lo conocen las empresas de marketing que siguen cada clic, cada intención. Lo saben los encargados del user experience (UX) detrás de cada uno de los servicios que consumimos: qué buscamos, cómo nos comportamos, cuándo lo usamos y, sobre todo, cuándo no.

Hoy damos muchos más datos de los que dábamos hace 10 años, y muchísimos más de los que dábamos hace 40, cuando empezó el período democrático más largo de nuestra historia. Pero no solo eso: lo que otorgábamos entonces quedaba limitado a un entorno. Ahora ya no. Esos datos están en la nube, uniéndose con otros. Hablando de nosotros. Y esto trae dos problemas, muy relacionados con los objetivos de un sistema democrático como el que se recuperó en 1983. Por un lado, el riesgo de la pérdida de derechos por alguna filtración. Volvamos a la salud: si algo circula o se pierde, y un tercero accede, puede transformarse en una prima más cara, o en la imposibilidad de acceder a ciertos trabajos por las condiciones preexistentes. Perder privacidad no es solo perder derechos en abstracto, sino en concreto. Y por otro lado, para lograr una democracia sana hay que garantizar la autonomía personal, que una persona no se sienta condicionada ni amenazada por lo que dice. ¿Cómo puede esto compatibilizarse hoy con la vigilancia permanente? ¿Somos libres de decir lo que pensamos?

Mientras tanto no tenemos muchas otras opciones que estar de acuerdo con que nuestros datos se digitalicen, y rogamos que el dato sea cuidado. O que alguien nos cuide. Pero, ¿quién podrá ayudarnos?