Las células del corazón y de la piel, aunque contienen instrucciones idénticas para crear proteínas codificadas en su ADN, pueden desempeñar funciones tan diferentes debido a la capacidad de la maquinaria molecular para recortar y unir diferentes segmentos de esas instrucciones, creando combinaciones únicas.
Este ingenio de utilizar los mismos genes de diferentes maneras es posible gracias a un proceso conocido como splicing, que está controlado por factores de splicing. La elección de los factores de splicing que una célula emplea determina qué conjuntos de instrucciones produce, lo que a su vez genera proteínas que permiten a las células cumplir con distintas funciones.
Investigación innovadora
En un artículo de acceso abierto publicado en Nature Biotechnology, investigadores del Departamento de Biología del MIT presentaron un marco para analizar la compleja relación entre las secuencias y la regulación del splicing. Este estudio investiga las actividades regulatorias de los factores de splicing, creando modelos que pueden aplicarse para interpretar y predecir la regulación del splicing en diferentes tipos celulares e incluso en distintas especies. Llamado KATMAP, este modelo se basa en datos experimentales que interrumpen la expresión de un factor de splicing y en información sobre las secuencias con las que interactúa para predecir sus posibles objetivos.
Además de los beneficios de una mejor comprensión de la regulación genética, las mutaciones en el splicing —ya sea en el gen que se está splicing o en el propio factor de splicing— pueden dar lugar a enfermedades como el cáncer, alterando cómo se expresan los genes y llevando a la creación o acumulación de proteínas defectuosas o mutadas. Esta información es crucial para el desarrollo de tratamientos terapéuticos para dichas enfermedades. Los investigadores también demostraron que KATMAP puede utilizarse potencialmente para predecir si ácidos nucleicos sintéticos, una opción de tratamiento prometedora para trastornos como ciertos tipos de atrofia muscular y epilepsia, afectan el splicing.
Comprendiendo el proceso
En las células eucariotas, incluido nuestro propio organismo, el splicing ocurre después de que el ADN es transcrito para producir una copia de ARN de un gen, que contiene tanto regiones codificantes como no codificantes. Las regiones intrónicas no codificantes son eliminadas, y los segmentos exónicos codificantes son unidos nuevamente para crear un plano casi final, que puede ser traducido a una proteína.
Según el autor principal Michael P. McGurk, un postdoctorado en el laboratorio del profesor del MIT Christopher Burge, enfoques anteriores podían ofrecer una imagen promedio de la regulación, pero no necesariamente predecir la regulación de los factores de splicing en exones particulares de genes específicos.
KATMAP se basa en datos de secuenciación de ARN generados a partir de experimentos de perturbación, que alteran el nivel de expresión de un factor regulador mediante su sobreexpresión o disminución. Las consecuencias de la sobreexpresión o disminución son que los genes regulados por el factor de splicing deberían mostrar diferentes niveles de splicing después de la perturbación, lo que ayuda al modelo a identificar los objetivos del factor de splicing.
Desafíos y objetivos
Sin embargo, las células son sistemas complejos e interconectados, donde un pequeño cambio puede causar una cascada de efectos. KATMAP también es capaz de distinguir entre objetivos directos e indirectos, incorporando información conocida sobre la secuencia con la que el factor de splicing probablemente interactúe, conocida como sitio de unión o motivo de unión.
“En nuestros análisis, identificamos los objetivos predichos como exones que tienen sitios de unión para este factor particular en las regiones donde este modelo piensa que deben estar para impactar la regulación”, dice McGurk, mientras que los no objetivos pueden verse afectados por la perturbación pero no tienen los sitios de unión apropiados cercanos.
Esto es especialmente útil para los factores de splicing que no han sido tan estudiados.
Modelos interpretables
“Uno de nuestros objetivos con KATMAP era intentar hacer el modelo lo suficientemente general como para que pudiera aprender lo que necesita asumir para factores particulares, como qué tan similar debe ser el sitio de unión al motivo conocido o cómo cambia la actividad reguladora con la distancia de los sitios de unión desde los sitios de splicing”, explica McGurk.
Aunque los modelos predictivos pueden ser muy poderosos para presentar hipótesis posibles, muchos son considerados “cajas negras”, lo que significa que la razón detrás de sus conclusiones no está clara. KATMAP, por el contrario, es un modelo interpretable que permite a los investigadores generar rápidamente hipótesis e interpretar patrones de splicing en términos de factores regulatorios, al tiempo que también comprenden cómo se hicieron las predicciones.
“No solo quiero predecir cosas, quiero explicar y entender”, dice McGurk. “Configuramos el modelo para aprender de la información existente sobre el splicing y la unión, lo que nos da parámetros biológicamente interpretables.”
Próximos pasos
El laboratorio de Burge está colaborando con investigadores del Dana-Farber Cancer Institute para aplicar KATMAP a la cuestión de cómo se alteran los factores de splicing en contextos de enfermedad, así como con otros investigadores en el MIT como parte de una subvención MIT HEALS para modelar los cambios de los factores de splicing en respuestas al estrés. McGurk también espera extender el modelo para incorporar la regulación cooperativa para los factores de splicing que trabajan juntos.
“Todavía estamos en una fase muy exploratoria, pero me gustaría poder aplicar estos modelos para intentar entender la regulación del splicing en enfermedades o en el desarrollo. En términos de variación de factores de splicing, están relacionados, y necesitamos entender ambos”, afirma McGurk.
Burge, profesor Uncas (1923) y Helen Whitaker y autor senior del artículo, continuará trabajando en generalizar este enfoque para construir modelos interpretables para otros aspectos de la regulación genética.
