La inteligencia artificial de Google predice la estructura de todas las proteínas conocidas y abre un nuevo universo para la ciencia | Gaiástech

La inteligencia artificial de Google predice la estructura de todas las proteínas conocidas y abre un nuevo universo para la ciencia

adn
  • Un algoritmo resuelve uno de los mayores problemas de la biología actual al calcular la forma de 200 millones de moléculas, algunas de ellas esenciales para entender enfermedades devastadoras como el alzhéimer o el párkinson
     

Una inteligencia artificial propiedad de Google ha predicho la estructura de casi todas las proteínas conocidas; unos 200 millones de moléculas esenciales para comprender la biología de todos los seres vivos del planeta y los mecanismos de algunas de las enfermedades más prevalentes, desde la malaria hasta el alzhéimer y el cáncer.

Conocer la estructura tridimensional de estas moléculas a partir de su secuencia genética es esencial para entender su función, pero supone un problema de inmensa dificultad. Es como terminar un puzle con decenas de miles de piezas sin saber qué imagen representa.

Hasta la aparición de este sistema, dilucidar la forma de una sola proteína compuesta por 100 unidades básicas —llamadas aminoácidos— podía llevar 13.700 millones de años, la edad del universo. En el mejor de los casos, los científicos tardaban años usando microscopía electrónica o enormes aceleradores de partículas como el sincrotrón europeo de Grenoble (Francia). En cambio, el algoritmo de Google predice la estructura de cualquier proteína en unos pocos segundos.

Antes de la llegada de esta tecnología, se había conseguido determinar la estructura de unas 200.000 proteínas, una labor que llevó 60 años y la participación de miles de científicos. Esa base de datos ha sido el material de aprendizaje de la inteligencia artificial de Google, que ha buscado patrones válidos que predigan qué forma tendrán las proteínas de las que solo se conoce su secuencia bidimensional. En 2021, el sistema ya resolvió la estructura de un millón de proteínas, incluidas todas las humanas. La nueva remesa de este año amplía el récord a 200 millones: prácticamente todas las proteínas conocidas de todos los seres vivos del planeta.

El acceso a esta nueva base de datos es libre y gratuito y el código informático de su inteligencia artificial es abierto y descargable. Este Google de la vida muestra la secuencia bidimensional de cualquier proteína y un modelo tridimensional que indica el nivel de fiabilidad de la predicción, que tiene un margen de error similar o incluso menor que los métodos convencionales.

Fuente: El País