Ministerio de Ciencia e Innovación

Crean la primera base de datos con las variables genéticas de la población española

CIBER | miércoles, 7 de octubre de 2020

Investigadores españoles han creado la primera base de datos de la variabilidad genética de la población española. La plataforma, denominada Servidor Colaborativo de Variabilidad Española (CSVS, se sus siglas en inglés: Collaborative Spanish Variability Server), recoge un total de 2.027 genomas y exomas de individuos españoles no emparentados.

Los resultados de este trabajo se han publicado en la prestigiosa revista Nucleic Acids Research. El trabajo ha sido coordinado por investigadores de la U715 CIBERER que lidera Joaquín Dopazo en el Área de Bioinformática Clínica del Sistema Sanitario Público de Andalucía.

En el estudio, han participado científicos de otros 4 grupos del CIBERER (U702, U704, U711 y U728) que trabajan en el marco de la Plataforma de Bioinformática para las Enfermedades Raras (BIER) de este centro. Diferentes consorcios y proyectos han contribuido a aportar las secuencias, como el Proyecto de Enfermedades No Diagnosticadas (ENoD) del CIBERER, Proyecto Genoma 1000 Navarra o la red Rare Genomics de Madrid, entre otros.

Este repositorio contribuirá al desarrollo y la aplicación de la medicina personalizada, ya que el conocimiento de la variabilidad genética de la población local es de suma importancia en este ámbito y se ha revelado, además, como un factor determinante para el descubrimiento de nuevas variantes de la enfermedad.

Y es que las tecnologías de secuenciación han contribuido a un mayor conocimiento de las mutaciones relacionadas con las enfermedades, especialmente en aquellas con una elevada morbilidad y mortalidad. De hecho, en la actualidad, más de 4.500 enfermedades monogénicas (causadas por la mutación de un solo gen) pueden ser diagnosticadas directamente mediante genómica personalizada, posibilidad que podría aplicarse en un futuro cercano a todo el espectro de enfermedades raras de origen genético.

Los investigadores de este proyecto explican que por norma general se tiende a secuenciar principalmente los genomas de personas con alguna enfermedad y no de personas sanas. Sin embargo, precisan, “es necesario contar con la información genómica de los pacientes sanos para discriminar e identificar nuevas variantes genómicas de las enfermedades”. En este sentido, este proyecto plantea que, en general, los pacientes de una enfermedad pueden considerarse como controles sanos para otra enfermedad suficientemente distinta; por ejemplo, un paciente con cardiopatía puede considerarse un control sano para una ceguera congénita, y viceversa. Se trata de un enfoque original e innovador en este ámbito.

Abundando en este enfoque, en el Servidor Colaborativo de Variabilidad Española las secuencias se han agrupado por categorías superiores ICD10 (clasificación internacional de las enfermedades), de modo que la interfaz web permite consultar la base de datos eliminando una o más categorías de dicha clasificación. Así, se pueden obtener recuentos de variantes en genomas de la población española sana que servirían como pseudocontroles para estudios de búsqueda de nuevos genes e incluso algunos estudios poblacionales como, por ejemplo, la prevalencia de variantes farmacogenómicas.

Un proyecto de crowdsourcing

El Servidor Colaborativo de Variabilidad Española es el primer repositorio local de variabilidad producido enteramente por un esfuerzo de crowdsourcing y constituye un ejemplo para futuras iniciativas en otros países para caracterizar la variabilidad local en todo el mundo.

El crowdsourcing es un término inglés resultante de las palabras crowd (multitud) y outsourcing (recursos externos)que hace alusión a una actividad participativa, generalmente convocada con ayuda de las nuevas tecnologías -fundamentalmente internet. A través de este procedimiento, una persona, institución, organización sin ánimo de lucro o empresa, propone a un grupo de individuos, mediante una convocatoria abierta y flexible, la realización libre y voluntaria de una tarea.

 

Artículo de referencia:

“CSVS, a crowdsourcing database of the Spanish population genetic variability”. María Peña-Chilet, Gema Roldán, Javier Perez-Florido, Francisco M Ortuño, Rosario Carmona, Virginia Aquino, Daniel Lopez-Lopez, Carlos Loucera, Jose L Fernandez-Rueda, Asunción Gallego, Francisco García-Garcia, Anna González-Neira, Guillermo Pita, Rocío Núñez-Torres, Javier Santoyo-López, Carmen Ayuso, Pablo Minguez, Almudena Avila-Fernandez, Marta Corton, Miguel Ángel Moreno-Pelayo, Matías Morin, Alvaro Gallego-Martinez, Jose A Lopez-Escamez, Salud Borrego, Guillermo Antiñolo, Jorge Amigo, Josefa Salgado-Garrido, Sara Pasalodos-Sanchez, Beatriz Morte, The Spanish Exome Crowdsourcing Consortium, Ángel Carracedo, Ángel Alonso, Joaquín Dopazo. Nucleic Acids Research.

doi: 10.1093/nar/gkaa794