ESMFold2 es el motor de predicción de estructuras dentro de la arquitectura ESM3. Predice la estructura atómica de las proteínas directamente de su secuencia con una velocidad y precisión de última generación, y no necesita los alineamientos múltiples de secuencias que ralentizan los métodos tradicionales . Gracias a esta velocidad es posible una cobertura estructural a gran escala.
El Atlas ESM se ha expandido de forma drástica. El Atlas Metagenómico ESM original de Meta FAIR cubría unos 600 millones de estructuras proteicas . El atlas actualizado de Biohub ahora cartografía 6.800 millones de proteínas con 1.100 millones de estructuras predichas, una expansión de un orden de magnitud que ofrece cobertura estructural para una porción muchísimo mayor del universo proteico
.
Además, el lanzamiento incluye esm3-sm-open-v1, un modelo generativo entrenado con 2.780 millones de proteínas naturales y aumentado con datos sintéticos hasta alcanzar 3.150 millones de secuencias, 236 millones de estructuras y 539 millones de anotaciones funcionales, sumando 771.000 millones de tokens . Este modelo se publica bajo una licencia no comercial para uso académico y sin fines de lucro
.
La promesa práctica es la velocidad y la escala. Diseñar y validar aglutinantes terapéuticos de proteínas tradicionalmente lleva meses o años de trabajo iterativo en el laboratorio. Las herramientas de Biohub comprimen este proceso a semanas o incluso días al permitir tres capacidades:
Una crítica recurrente a las proteínas diseñadas por IA es que se ven bien en la pantalla del ordenador pero fallan en el laboratorio. Biohub informa que este no es el caso. Los aglutinantes diseñados completamente in silico con estos modelos han sido validados en experimentos reales de laboratorio: las proteínas creadas por IA se unieron a sus objetivos previstos .
Alex Rives, director científico de Biohub, afirmó que "estos modelos han adquirido una representación tan precisa de los procesos biológicos que permiten el diseño computacional de interfaces proteicas, las cuales luego pueden ser probadas en el laboratorio con los resultados esperados" . Esto significa que los modelos han capturado suficiente biología fundamental como para producir diseños funcionales sin necesidad de optimización iterativa en el laboratorio.
El 29 de abril de 2026, Biohub anunció la Iniciativa de Biología Virtual (VBI, por sus siglas en inglés), un compromiso de 500 millones de dólares a cinco años para construir los conjuntos de datos multimodales y los modelos de IA necesarios para lograr modelos predictivos de las células humanas . De ese financiamiento, 100 millones se destinan a coordinar los esfuerzos globales de generación de datos, y 400 millones a producir datos a gran escala y desarrollar tecnologías de nueva generación para medir, visualizar y manipular la biología
.
La publicación del modelo de biología proteica es el primer gran resultado científico bajo esta iniciativa. Los socios de la VBI abarcan algunas de las instituciones más prominentes en biología y tecnología: el Broad Institute, el Allen Institute, el Arc Institute, el Wellcome Sanger Institute, el Human Cell Atlas, el Human Protein Atlas, NVIDIA y Renaissance Philanthropy .
La familia ESM no empezó en Biohub. Fue desarrollada originalmente en el laboratorio FAIR de Meta AI, que publicó los primeros modelos ESM-1 y lanzó el ESMFold original en la revista Science en 2023, generando las primeras predicciones de más de 600 millones de estructuras proteicas . Ese trabajo produjo el Atlas Metagenómico ESM original, que en su momento fue la mayor base de datos de estructuras predichas de alta resolución, aproximadamente tres veces más grande que cualquier base de datos de estructuras proteicas existente
.
Cuando EvolutionaryScale, la startup formada por el equipo original de ESM en FAIR, se escindió de Meta, Biohub absorbió y continuó la investigación. Este lanzamiento de cuarta generación se basa directamente en ese linaje, con Biohub ahora liderando el desarrollo como una iniciativa científica filantrópica y abierta .
Los investigadores pueden experimentar y desplegar estas herramientas en múltiples plataformas:
esm3-sm-open-v1 y ESMC 600M están alojados en huggingface.co/biohub/ bajo una licencia no comercial biohub.org/ai-models para explorar y descargar los modelos
Comments
0 comments