El anonimato se hizo imposible gracias a la genética
(CNN) - A principios del 2000 las pruebas genéticas surgieron como producto de consumo que no exigía la participación de un médico y cuyas consecuencias podrían impactar a todo el mundo.
Se puede identificar a más de 60% de las personas de ascendencia europea a través de una muestra anónima de ADN, con base en el uso de información de las bases de datos genéticas comerciales. Este porcentaje incluye a quienes no se han sometido a alguna prueba de este tipo, según el estudio que se publicó en la revista Science el jueves 11 de octubre.
"Usualmente pensamos en las pruebas de paternidad. Puedes encontrar al padre, a los hermanos… pero con el avance de las técnicas genómicas más poderosas, ahora puedes identificar a primos terceros, incluso primos cuartos en algunos casos", dijo Yaniv Erlich, director del estudio y profesor asociado de Ciencias Computacionales de la Universidad de Columbia. Una vez que encuentras a los parientes lejanos, una muestra "anónima" de ADN puede llevarte a una persona específica.
Lee: Investigadores encuentran gen responsable de la disfunción eréctil
¿Te fuiste de pesca?
Hasta abril de este año, más de 15 millones de personas habían usado pruebas genéticas comerciales, de acuerdo con Erlich y sus colegas. Como la mayoría de las empresas de pruebas genéticas permiten que sus clientes descarguen archivos con su información genética sin procesar ya han surgido servicios de terceros como GEDmatch, que permite que las personas suban sus datos sin procesar para que se los analice más a fondo y se lleven a cabo búsquedas de ancestros, por ejemplo.
Estos servicios atraen a muchos, incluyendo a personas adoptadas que buscan a sus familiares biológicos, ya que amplía su indagación más allá de la empresa en la que se hicieron la prueba. En palabras de Elrich, "si pescas en más estanques puedes encontrar algo".
De hecho, GEDmatch, cuyo fin es exclusivamente la investigación genealógica, fue instrumental para encontrar al escurridizo sospechoso de los asesinatos del Golden State. Este año, los investigadores capturaron a un sospechoso tras casi 32 años de la serie de asesinatos gracias a una muestra de ADN, con la que llevaron a cabo lo que se conoce como búsqueda familiar de largo alcance.
Lee: Genómica médica, la startup que analiza tu perfil genético en horas
Dicha búsqueda ayudó a las corporaciones policiacas a identificar a un primo tercero del violador y asesino serial, mientras que la información adicional sirvió para que los investigadores encontraran un sospechoso, cuya identidad confirmaron con una prueba estándar de ADN.
De esta manera las búsquedas familiares de largo alcance se volverán una herramienta investigativa estándar, según Erlich y sus colegas, así que llevaron a cabo un estudio para entender su poder. Comenzaron con un análisis de más de un millón de genomas anónimos que secuenció MyHeritage, un proveedor de pruebas genéticas comerciales del que Erlich es director científico.
"Ahora tenemos una base de datos de más de 1.75 millones de individuos y ofrecemos básicamente una prueba que te puede servir para enterarte de tu pasado y encontrar a tus familiares", dijo Erlich, quien explicó que él y sus colegas querían "ver cómo es el perfil de coincidencias que obtienes con un individuo".
Lee: El origen de los incas es investigado
En el estudio se destacan los resultados de personas de ascendencia europea porque "resulta que este es el grupo más grande en nuestra base de datos", dijo.
En alrededor del 60% de los individuos anónimos cuyo genoma se analizó (todos de ascendencia europea), los investigadores pudieron encontrar un primo tercero o un grado más cercano. En el 15% de estos casos, el familiar más cercano que se encontró fue un primo segundo o un grado más cercano.
Luego el equipo repitió este procedimiento en GEDmatch, un sitio web no relacionado con una política de privacidad que permite que los usuarios comparen aquellos archivos anónimos cuyos propietarios dejaron "abiertos al público".
Lee: Humanos editados, ¿la siguiente desigualdad social?
El equipo de Erlich descubrió que ambas bases de datos, que usan estrategias diferentes para identificar a los familiares biológicos, arrojaron resultados similares. Con esto se demostró que el método puede replicarse con bases de datos diferentes.
Como el grupo de científicos volvió a identificar a una mujer a partir de datos de ADN "anónimos" (aunque abiertos al público), se ilustró que una vez que encuentras a los familiares es posible volver a identificar a una persona anónima a través de un árbol genealógico, buscando familiares adicionales y triangulando a partir de ahí.
La información contenida en las bases de datos genéticos representa una porción reducida de la población total de Estados Unidos, aclaró Erlich, quien junto con sus colegas, estima que una vez que las bases de datos contengan a alrededor del 2% de la población se podría empatar a casi cualquier persona con al menos un primo tercero y se podría concebir la posibilidad de identificarla a través de ADN.
Lee: 3 problemas que puede resolver la edición genética
Dado el rápido crecimiento de la genómica comercial estas posibilidades podrían concretarse en el futuro cercano, concluyeron.
Una combinación de bases de datos
Noah Rosenberg, profesor de Biología de la Universidad de Stanford, dijo que el estudio de Erlich "demuestra que el caso del asesino del Golden State no fue una anomalía".
"En una fracción bastante grande de los casos, sería posible usar la misma técnica de ese caso para identificar a la persona que aportó la muestra de ADN", dijo Rosenberg, quien no participó en el estudio pero dirigió una investigación diferente que se publicó en la revista Cell.
Lee: Los Bajau, ¿adaptados genéticamente para bucear?
Con su estudio, Rosenberg y sus colegas querían saber "si las bases de datos que se usan comúnmente en la genética forense pueden comunicarse con las bases de datos de uso común en investigación biomédica, genealógica y de genómica personal".
Las pruebas de ADN comenzaron a aceptarse en los tribunales estadounidenses a finales de la década de 1980 y desde entonces las autoridades han recopilado ADN. De acuerdo con Rosenberg, como cada tipo de base de datos "usa partes diferentes del genoma", la técnica que usó en su estudio fue diferente del método que se utilizó en el caso del asesino del Golden State.
Uno de los patólogos tenía una muestra conservada del ADN del asesino, lo que permitió que los investigadores de casos rezagados volvieran a secuenciar y a identificar más marcadores genéticos que los que se encuentran en los reportes forenses típicos. "Si la muestra de ADN no está disponible para ello, lo que usualmente estaría disponible serían los marcadores genéticos forenses", explicó Rosenberg.
Lee: Descubren una mutación genética que causa esclerosis y demencia familiares
Si las autoridades tienen menos información disponible, ¿qué pasa cuando los investigadores no pueden volver a analizar una muestra de ADN?
"Es científicamente posible hacer relaciones entre diferentes tipos de bases de datos. Pudimos encontrar coincidencias de marcadores genéticos no empalmados entre muestras de bases de datos en más del 90% de los casos, cuando la muestra era del mismo individuo, y en alrededor del 30% cuando las muestras era de familiares cercanos. Las bases de datos diferentes, creadas con propósitos diferentes, podrían no aportar información suficiente por sí solas para identificar a una persona, pero al combinar la información de varias bases de datos, se puede lograr la identificación", explicó Rosenberg.
Tanto los estudios de Rosenberg como los de Erlich "tratan sobre este principio de que conectar varias bases de datos revela información que no contiene alguna de las bases de datos y que la gente que las creó no pretendía recabar", señaló.
Lee: Emprendedora introduce test genético de cáncer de mama al cuadro básico
Rosenberg espera que su estudio "ayude a catalizar la conversación entre varios interesados diferentes en la genética forense, en la privacidad de la genética y en las pruebas genealógicas".
Erlich y sus colegas concluyeron el estudio con ideas para reducir el mal uso de las bases de datos genéticas. Primero pidieron cambios a las reglas que permiten que los materiales de desecho de las clínicas se sometan a pruebas genéticas. Si se exige el consentimiento de las personas antes de hacer la prueba, "se protegerá mejor a los sujetos humanos", dijo.
También propusieron a las empresas de genética comercial que adopten una mejor estrategia de cifrado para que "haya medios técnicos para diferenciar las búsquedas legítimas de las ilegítimas".
Lee: El "arca de Noé vegetal" supera el millón de variedades
Rosenberg dijo que "esas ideas merecen discusión. Otra idea sería hablar de la clase de información que se considerará admisible en un tribunal".