A principios de este año, se supo que la policía había ideado un nuevo e inesperado método para resolver casos fríos. En lugar de utilizar el ADN de un sospechoso para identificarlos, se utilizaron los datos del ADN para buscar en los repositorios públicos e identificar a los familiares del presunto asesino.

Estos datos y un poco de construcción de árboles genealógicos, condujo a las autoridades a un número limitado de sospechosos y la eventual identificación de la persona acusada de los asesinatos de Golden State, un caso de la década de 1970 irresuelto. En los meses siguientes, se informó que más de una docena de otros casos se resolvieron de la misma manera.

Estudio encuentra un vínculo genético entre la enfermedad cardiaca y el Alzheimer

Analizando la información genética

Si bien la mayoría de las personas apoyaría la resolución de delitos utilizando este método, existen algunas implicaciones básicas de privacidad. Algunos pueden no sentirse cómodos con tener información genética personal sobre ellos mismos compartida indirectamente por sus familiares, generalmente sin permiso.

Los científicos forenses han resuelto más de una docena de casos utilizando esta técnica.

Ahora, un equipo de investigadores ha revisado y cuantificado las posibilidades de que alguien sea identificado a través de datos de genealogía pública.

Para hacerlo, utilizaron una base de datos administrada por la compañía de genealogía MyHeritage para analizar la información genética de casi 1.3 millones de personas anónimas a quienes una compañía de genómica directa ha analizado su ADN.

En casi el 60 por ciento de esas personas, fue posible rastrear a alguien cuyo ADN era lo suficientemente similar para indicar que eran primos terceros o más cercanos; para otro 15 por ciento de las muestras, se encontró primos segundos o más cercanos.

Los investigadores concluyeron que cuando se utilizan factores limitantes como la edad y la ubicación geográfica para acercarse a una persona de interés, más del 60 por ciento de los estadounidenses de ascendencia europea (la población con mayor representación en estas bases de datos) puede tener sus identidades reveladas de esta manera.

Privacidad comprometida

El investigador Yaniv Erlich, científico informático afiliado a la Universidad de Columbia, director científico en MyHeritage y autor principal del estudio manifestó que los hallazgos deberían hacer que los reguladores reconsideren la suposición de que la información genética está protegida. Al respecto expresó:

“Realmente no es el caso. Al menos técnicamente, parece factible identificar a una parte significativa de la población con tales investigaciones.”

Más de 15 millones de personas en todo el mundo se han realizado test genéticos.
LinkedIn agrega nuevos controles de privacidad para proteger los datos de los usuarios

Con esto en mente, los autores del estudio sugieren que las compañías que ofrecen genética directa al consumidor se estandaricen en un formato de archivo cifrado y firmado para obtener información sobre las variaciones.

Eso evitaría que las personas tomen información de ADN de otras fuentes, como los repositorios de secuencias de ADN, y la utilicen para rastrear a los miembros de su familia.

Referencia: Identity inference of genomic data using long-range familial searches. Science, 2018. https://doi.org/10.1126/science.aau4832

Más en TekCrispy