¡Inspirado por ChatGPT, Google DeepMind predice 71 millones de mutaciones genéticas! La IA descifra el código genético de los genes humanos en la ciencia

Fuente original: Xinzhiyuan

Fuente de la imagen: Generada por Unbounded AI‌

Después de que el modelo de predicción de proteínas AlphaFold desencadenara una ola a nivel de tsunami en el mundo de la IA, la familia Alpha marcó el comienzo de un nuevo advenedizo.

Hoy, Google DeepMind lanzó un nuevo modelo de inteligencia artificial, AlphaMissense, que puede predecir 71 millones de "mutaciones sin sentido".

Específicamente, del 89% de las "mutaciones sin sentido" predichas con éxito por AlphaMissense, el 57% fueron patógenas y el 32% benignas.

Dirección del papel:

Los expertos humanos sólo pueden confirmar el 0,1% de las mutaciones.

Para que los investigadores comprendan mejor su posible impacto, Google también ha hecho público el catálogo completo de decenas de millones de "mutaciones sin sentido".

Descubrir la causa subyacente ha sido durante mucho tiempo uno de los mayores desafíos de la genética humana.

Las mutaciones sin sentido son mutaciones genéticas que pueden afectar la función de las "proteínas humanas" y pueden provocar enfermedades como la fibrosis quística, la anemia falciforme y el cáncer.

El nacimiento de AlphaMissense demuestra el enorme potencial de la IA en el campo médico, especialmente en la genética.

Es de gran importancia para comprender la relación entre la variación genética y las enfermedades y desarrollar tratamientos farmacológicos específicos.

¡Después de AlphaFold, AlphaMissense puede convertirse en una IA que puede cambiar el mundo y se espera que supere los problemas de la genética humana!

**¿Qué es una "mutación sin sentido"? **

La mutación sin sentido es una mutación genética utilizada en los campos de la biomedicina y la biología molecular para describir genes codificadores de proteínas:

La sustitución de una sola letra en el ADN da como resultado un aminoácido diferente en una proteína.

Si piensas en el ADN como un lenguaje, entonces la sustitución de una sola letra puede cambiar una palabra y cambiar completamente el significado de una oración.

En este caso, los cambios en el ADN provocan cambios en los aminoácidos que afectan la función de la proteína.

La persona promedio porta más de 9.000 mutaciones sin sentido.

En términos generales, la mayoría de estas mutaciones sin sentido son benignas y tienen poco impacto en el cuerpo humano. Pero los pocos restantes son patógenos y pueden alterar gravemente la función de las proteínas.

Las mutaciones sin sentido se pueden utilizar para el diagnóstico de enfermedades genéticas raras, porque unas pocas o incluso una sola mutación sin sentido pueden causar directamente la enfermedad.

Además, son importantes para estudiar enfermedades complejas, como la diabetes tipo II, que puede ser causada por muchos tipos diferentes de variantes genéticas.

Por lo tanto, clasificar las mutaciones sin sentido es un paso importante para comprender qué cambios en las proteínas pueden contribuir a la enfermedad.

De los más de 4 millones de mutaciones sin sentido que han aparecido en humanos, sólo el 2% han sido etiquetadas por los expertos como patógenas o benignas.

Esto representa sólo alrededor del 0,1% de los 71 millones de mutaciones sin sentido posibles.

Las mutaciones restantes se clasificaron como "mutaciones de significado desconocido" debido a la falta de datos experimentales o clínicos sobre efectos relevantes.

Pero con AlphaMissense obtuvimos la imagen más clara hasta el momento de los efectos de la mutación:

AlphaMissense puede clasificar el 89% de las mutaciones con un umbral de precisión del 90% en una base de datos de mutaciones de enfermedades conocidas.

Construido en base a AlphaFold, inspirado en el modelo grande ChatGPT

Entonces, ¿cómo se construye exactamente AlphaMissense?

Desde su lanzamiento, AlphaFold y AlphaFold 2 han predicho la estructura de casi todas las proteínas conocidas por la ciencia a partir de sus secuencias de aminoácidos, más de 200 millones de proteínas.

En este sentido, los investigadores de Google adaptaron el modelo basado en AlphaFold (en adelante AF), para poder predecir la patogenicidad de mutaciones sin sentido que cambian un solo aminoácido en una proteína.

En pocas palabras, el principio de funcionamiento completo de AlphaMissense es: tomar una secuencia de aminoácidos como entrada y predecir la patogenicidad de todos los posibles cambios de aminoácidos individuales en una posición determinada de la secuencia.

Para entrenar el modelo AlphaMissense es necesario realizarlo en dos etapas:

El primer escenario

Entrene una red neuronal igual que AF. Esta red neuronal está inspirada en grandes modelos como ChatGPT.

Al predecir la identidad de los aminoácidos enmascarados en posiciones aleatorias en alineamientos de secuencias múltiples (MSA), permite la predicción de la estructura de una sola cadena, así como el modelado del lenguaje de proteínas.

Los investigadores realizaron algunas modificaciones arquitectónicas menores a la FA y aumentaron los pesos de pérdida para el modelado del lenguaje de proteínas, al mismo tiempo que lograron un rendimiento de predicción de estructuras comparable al de la FA.

Después del entrenamiento previo, el cabezal de modelado de lenguaje enmascarado ya se puede usar para la predicción del efecto de mutación calculando la relación de probabilidad logarítmica entre el aminoácido de referencia y las probabilidades de aminoácidos alternativos, como en MSA Transformer y Evolutionary Scaling Modeling (EMS).

Estas redes neuronales han demostrado ser buenas para predecir estructuras de proteínas y diseñar nuevas proteínas, y son especialmente útiles para la predicción de variantes porque ya saben qué secuencias son creíbles y cuáles no.

Segunda etapa

En esta etapa, los investigadores perfeccionaron el modelo en proteínas humanas, establecieron secuencias de mutación para la segunda línea de MSA y agregaron objetivos de clasificación de patogenicidad variantes.

Luego, siga el método de PrimateAI para etiquetar mutaciones en poblaciones humanas y de primates.

Las mutaciones comunes se consideran benignas y las mutaciones nunca antes vistas se consideran patógenas.

Una vez que el modelo comenzó a sobreajustarse en el conjunto de validación (2526 variantes de Clin, con igual número de variantes benignas y patógenas por gen), los investigadores dejaron de entrenar.

Sin embargo, AlphaMissense no predice cambios en la estructura de las proteínas después de mutaciones u otros efectos sobre la estabilidad de las proteínas.

En cambio, utiliza la "intuición" de AlphaFold sobre la estructura para identificar posibles mutaciones en proteínas que causan enfermedades.

Específicamente, se utilizan bases de datos de secuencias de proteínas relevantes e información del contexto estructural de la mutación para generar una puntuación continua entre 0 y 1 para aproximar la probabilidad patogénica de la mutación.

Esta puntuación continua permite a los usuarios seleccionar un umbral para clasificar las mutaciones como patógenas o benignas, según sus requisitos de precisión.

Cómo AlphaMissense clasifica las mutaciones sin sentido humanas

En la evaluación experimental, AlphaMissense logró predicciones de última generación en una amplia gama de puntos de referencia genéticos y experimentales, todo sin requerir capacitación explícita sobre dichos datos.

AlphaMissense supera a otros métodos computacionales al clasificar variantes de Clin. Clin es un archivo público de datos sobre la relación entre la variación humana y la enfermedad.

AlphaMissense también fue la forma más precisa de predecir los resultados de laboratorio, lo que sugiere que era consistente con diferentes formas de medir la patogenicidad.

AlphaMissense supera a otros métodos computacionales en la predicción de efectos de variantes sin sentido

La IA cambia la genética

Hace un año, Google DeepMind publicó 200 millones de estructuras proteicas predichas mediante AlphaFold.

Esta iniciativa ha ayudado a millones de científicos de todo el mundo a acelerar la investigación y allanó el camino para nuevos descubrimientos.

Ahora, AlphaMissense, basado en AlphaFold, ha profundizado aún más la comprensión mundial de las proteínas al rastrear el origen del ADN.

Una vez más, un paso clave para traducir esta investigación es la colaboración con la comunidad científica.

Google DeenpMind ha estado trabajando con Genomics England para explorar cómo las predicciones de AlphaMissense pueden ayudar a estudiar la genética de enfermedades raras.

Genome England cruzó los hallazgos de AlphaMissense con datos previamente compilados sobre la patogenicidad de mutaciones humanas conocidas.

Los resultados de la evaluación son consistentes con las predicciones de AlphaMissense, lo que proporciona a AlphaMissense un punto de referencia del mundo real.

Google DeepMind ha publicado una tabla de búsqueda de mutaciones sin sentido y ha compartido predicciones ampliadas de todas las posibles 216 millones de sustituciones de secuencias de un solo aminoácido en más de 19.000 proteínas humanas.

Los datos publicados también incluyen un valor promedio previsto para cada gen, que es similar a una medida de las limitaciones evolutivas de un gen, lo que indica cuán importante es ese gen para la supervivencia de un organismo.

Ejemplos predichos por AlphaMissense superpuestos a estructuras predichas por AlphaFold

(Rojo = se prevé que será patógeno, azul = se prevé que será benigno, gris = incierto)

Izquierda: subunidad de beta-hemoglobina (proteína HBB). Las variaciones en esta proteína pueden causar anemia falciforme.

Derecha: proteína reguladora de la conductancia transmembrana de la fibrosis quística (proteína CFTR). Las variaciones en esta proteína pueden provocar fibrosis quística.

Además, Google DeepMind también ha cooperado con EMBL-EBI. A través del predictor del efecto de mutación Ensembl, los investigadores aplicarán más fácilmente los resultados de predicción de AlphaMissense.

Se cree que en un futuro próximo AlphaMissense ayudará a resolver problemas centrales en genómica y en todas las ciencias biológicas.

Referencias:

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)