Las proteínas son las macromoléculas más versátiles en los sistemas vivos. Se estima que entre 20.000 y 30.000 proteínas trabajan en las células, donde llevan a cabo funciones cruciales en esencialmente todos los procesos biológicos. Una de las preguntas centrales de la bioquímica y la biología molecular, es cómo se determinan sus funciones.

De la misma manera que las especies, al haber descendido de un ancestro común, la mayoría de las proteínas pertenecen a familias relacionadas entre sí. Un enfoque que los científicos han adoptado para explorar cómo surgen las funciones de las proteínas, es rastrear la evolución y la relación de la familia de proteínas, pero reconstruir los giros y vueltas de la divergencia genética pasada es una tarea difícil.

Especificidad funcional

En una reciente publicación, una dupla de investigadores propone un inusual, pero más preciso método para rastrear cómo las proteínas divergieron con el tiempo, el cual puede proporcionar información valiosa sobre la relación entre la secuencia de proteínas, la estructura y la función de esa familia.

Las proteínas son las macromoléculas que llevan a cabo funciones cruciales en esencialmente todos los procesos biológicos.

Los investigadores están particularmente interesados en una familia de proteínas de señalización celular llamadas CaMKII (Calinas / Calmodulina dependiente de la quinasa II), jugadores clave en el desarrollo de trastornos neuropsiquiátricos, algunos tipos de cáncer, arritmias cardíacas y trastornos de fertilidad causados por señalización celular desregulada.

Para comprender las reglas que gobiernan la especificidad funcional de esta familia de proteínas, y aplicar ese conocimiento para diseñar tratamientos altamente específicos, los investigadores construyeron una proteína ancestral de secuencia conocida, y luego simularon una serie de sustituciones de aminoácidos para llegar a una colección de secuencias de proteínas realistas, para las cuales conocerían toda su historia evolutiva.

En lugar de reconstruir todas las posibles divergencias de las proteínas, el método propuesto por los investigadores se centra en solo una parte de la historia para generar muchas versiones diferentes, lo que produce un conjunto de posibles soluciones.

Mayor precisión

Como explica el biólogo molecular Roman Sloutsky, afiliado al Departamento de Bioquímica de la Universidad de Massachusetts y coautor de la metodología:

“Reconstruimos menos que otros métodos, pero la parte que reconstruimos la hacemos con mayor precisión. Nuestra metodología, ASPEN (Accuracy through Subsampling of Protein EvolutioN), produce modelos topológicos significativamente más precisos que los producidos por una reconstrucción de alineación única a partir de todas las secuencias disponibles”.

Una de las preguntas centrales de la bioquímica y la biología molecular, es cómo se determinan las funciones de las proteínas.

Los autores reconocen que no se trata de un método tradicional, sino de un enfoque que aprovecha lo sabido sobre cómo evolucionan las familias de proteínas, pero de una manera innovadora.

Aunque durante muchos años esto fue un hecho conocido, no fue aprovechado. Los autores se enfocaron en ello al reconstruir varios modelos plausibles, y dependiendo de cuán precisa sea la predicción, el método puede entregar uno o una colección de candidatos con la promesa de que todos son tan precisos como sea posible.

Referencia: ASPEN, a methodology for reconstructing protein evolution with improved accuracy using ensemble models. eLife, 2019. https://doi.org/10.7554/eLife.47676