Tecnociencia

AlphaFold, la base de datos gratuita y abierta de estructuras de proteínas 

Mediante inteligencia artificial (IA), la empresa británica DeepMind y el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular (EMBL-EBI) han conseguido realizar predicciones de las estructuras tridimensionales de casi todas las proteínas conocidas y catalogadas por la ciencia para ofrecerlas, de forma gratuita y abierta, en la base de datos de estructuras de proteínas AlphaFold.

Esta herramienta y base de datos de DeepMind, adquirida a su vez por Google en 2014, se ha ido desarrollando en los últimos años, pero la novedad ahora es que se amplía unas 200 veces, de casi un millón de estructuras de proteínas a más de 200 millones, cubriendo casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado.

Esta actualización incluye estructuras proteicas predichas para multitud de especies, incluidas plantas, bacterias, animales y otros organismos, lo que abre nuevas vías de investigación en ciencias de la vida con impacto en desafíos globales, como la sostenibilidad, la falta de alimentos y enfermedades olvidadas, según informa el EMBL-EBI.

Además, este lanzamiento abrirá nuevas vías de investigación en bioinformática y computación, al permitir a los investigadores detectar patrones y tendencias en la base de datos. También se presentarán las estructuras predichas de las proteínas en UniProt (universal protein), un repositorio central de referencia.

AlphaFold ahora ofrece una vista en 3D del universo de las proteínas; ha sorprendido la velocidad a la que se ha convertido en una herramienta esencial para cientos de miles de científicos en laboratorios y universidades de todo el mundo.

La estructura de la proteína vitelogenina (precursora de la yema de huevo) predicha por la herramienta AlphaFold. / DeepMind
La estructura de la proteína vitelogenina (precursora de la yema de huevo) predicha por la herramienta AlphaFold. / DeepMind

Desde la lucha contra las enfermedades hasta la contaminación por plásticos, AlphaFold ya ha permitido un impacto increíble en algunos de nuestros mayores desafíos globales. La esperanza es que esta base de datos ampliada ayude a muchos más investigadores en su trabajo y abra vías completamente nuevas de descubrimiento.

DeepMind y EMBL-EBI lanzaron AlphaFold en julio de 2021, con más de 350.000 predicciones de estructuras de proteínas, incluido el proteoma humano completo. Las actualizaciones posteriores permitieron la adición de repositorios como UniProt y 27 nuevos proteomas, 17 de los cuales representan enfermedades tropicales desatendidas que continúan devastando las vidas de más de mil millones de personas en todo el mundo.

En poco más de un año, más de mil artículos científicos han citado esta base de datos y más de 500.000 investigadores de más de 190 países han accedido a AlphaFold para ver más de dos millones de estructuras.

La comunidad científica también ha aprovechado este sistema para crear y adaptar herramientas como Foldseek y Dali, que permiten a los usuarios buscar entradas de proteínas concretas. También se han adoptado las ideas centrales de aprendizaje automático que están detrás de este programa de inteligencia artificial para desarrollar nuevos algoritmos o aplicarlos en áreas como la predicción de la estructura del ARN o la creación de nuevos modelos proteicos.

Según sus promotores, AlphaFold también ha ayudado a mejorar nuestra capacidad para combatir la contaminación de los plásticos, obtener información sobre la enfermedad de Parkinson, aumentar la salud de las abejas melíferas, comprender cómo se forma el hielo, abordar enfermedades desatendidas como la enfermedad de Chagas y la leishmaniasis, y explorar la evolución humana.

DeepMind y EMBL-EBI continuarán actualizando AlphaFold periódicamente para mejorar sus características y funcionalidad en respuesta a los comentarios de los usuarios. El acceso a las estructuras seguirá siendo completamente abierto, bajo una licencia Creative Commons, y las descargas masivas estarán disponibles a través de Google Cloud.

Fuente: SINC