A intelixencia artificial de Google podrá predicir a estrutura de todas as proteínas coñecidas e abre un novo universo para a ciencia | Gaiástech

A intelixencia artificial de Google podrá predicir a estrutura de todas as proteínas coñecidas e abre un novo universo para a ciencia

adn
  • Un algoritmo resolve un dos maiores problemas da bioloxía actual ao calcular a forma de 200 millóns de moléculas, algunhas delas esenciais para entender enfermidades devastadoras como o alzhéimer ou o párkinson
     

Unha intelixencia artificial propiedade de Google predixo a estrutura de case todas as proteínas coñecidas; uns 200 millóns de moléculas esenciais para comprender a bioloxía de todos os seres vivos do planeta e os mecanismos dalgunhas das enfermidades máis prevalentes, desde a malaria ata o alzhéimer e o cancro.

Coñecer a estrutura tridimensional destas moléculas a partir da súa secuencia xenética é esencial para entender a súa función, pero supón un problema de inmensa dificultade. É como terminar un quebracabezas con decenas de miles de pezas sen saber que imaxe representa.

Ata a aparición deste sistema, dilucidar a forma dunha soa proteína composta por 100 unidades básicas —chamadas aminoácidos— podía levar 13.700 millóns de anos, a idade do universo. No mellor dos casos, os científicos tardaban anos usando microscopía electrónica ou enormes aceleradores de partículas como o sincrotrón europeo de Grenoble (Francia). En cambio, o algoritmo de Google predicir a estrutura de calquera proteína nuns poucos segundos.

Antes da chegada desta tecnoloxía, conseguiuse determinar a estrutura dunhas 200.000 proteínas, un labor que levou 60 anos e a participación de miles de científicos. Esa base de datos foi o material de aprendizaxe da intelixencia artificial de Google, que buscou patróns válidos que predigan que forma terán as proteínas das que só se coñece a súa secuencia bidimensional. En 2021, o sistema xa resolveu a estrutura dun millón de proteínas, incluídas todas as humanas. A nova remesa deste ano amplía o récord a 200 millóns: practicamente todas as proteínas coñecidas de todos os seres vivos do planeta.

O acceso a esta nova base de datos é libre e gratuíto e o código informático da súa intelixencia artificial é aberto e descargable. Este Google da vida mostra a secuencia bidimensional de calquera proteína e un modelo tridimensional que indica o nivel de fiabilidade da predición, que ten unha marxe de erro similar ou mesmo menor que os métodos convencionais.

Fuente: El País