ESMFold2 adalah mesin prediksi struktur di dalam arsitektur ESM3. Mesin ini memprediksi struktur protein tingkat atom langsung dari data rangkaian dengan kecepatan dan akurasi mutakhir, tanpa memerlukan penjajaran banyak rangkaian (multiple sequence alignments) yang biasanya memperlambat metode tradisional . Kecepatan inilah yang memungkinkan cakupan struktural dalam skala besar.
ESM Atlas telah diperluas secara dramatis. Atlas asli, ESM Metagenomic Atlas dari Meta FAIR, mencakup sekitar 600 juta struktur protein . Atlas terbaru Biohub kini memetakan 6,8 miliar protein dengan 1,1 miliar struktur yang diprediksi, sebuah ekspansi sepuluh kali lipat yang memberikan cakupan struktural di sebagian besar "semesta" protein
.
Sebagai tambahan, rilis ini juga mencakup esm3-sm-open-v1, model generatif yang dilatih dari 2,78 miliar protein alami dan diperkaya dengan data sintetis menjadi 3,15 miliar rangkaian, 236 juta struktur, dan 539 juta anotasi fungsi, dengan total 771 miliar token . Model ini dirilis di bawah lisensi non-komersial untuk penggunaan akademik dan nirlaba
.
Manfaat praktisnya adalah kecepatan dan skala. Merancang dan memvalidasi pengikat protein untuk terapi biasanya membutuhkan waktu berbulan-bulan atau bertahun-tahun di laboratorium basah (wet-lab). Perangkat dari Biohub memampatkan proses ini menjadi hitungan minggu atau hari dengan tiga kemampuan utama:
Kritik yang sering muncul pada protein rancangan AI adalah bahwa desainnya terlihat bagus di komputer tetapi gagal di laboratorium. Biohub melaporkan bahwa hal itu tidak terjadi di sini. Pengikat yang dirancang sepenuhnya secara in silico menggunakan model ini telah divalidasi dalam uji laboratorium nyata—protein hasil rancangan AI benar-benar mengikat target yang dimaksud .
Alex Rives, kepala sains di Biohub, menyatakan bahwa "model-model ini telah memperoleh representasi proses biologis yang sangat tepat sehingga memungkinkan desain komputasional antarmuka protein, yang kemudian dapat diuji di lab dengan hasil yang sesuai harapan" . Ini berarti model-model tersebut telah menangkap biologi fundamental yang cukup untuk menghasilkan desain fungsional tanpa memerlukan optimasi iteratif di laboratorium basah.
Pada 29 April 2026, Biohub mengumumkan Virtual Biology Initiative (VBI), komitmen lima tahun senilai $500 juta untuk membangun dataset multi-modal dan model AI yang dibutuhkan untuk menciptakan model prediktif sel manusia . Dari total dana tersebut, $100 juta dialokasikan untuk mengoordinasikan upaya pengumpulan data global, dan $400 juta didedikasikan untuk menghasilkan data dalam skala besar serta mengembangkan teknologi mutakhir untuk mengukur, mencitrakan, dan merekayasa biologi
.
Rilis model biologi protein ini adalah hasil ilmiah besar pertama di bawah bendera VBI. Para mitra inisiatif ini mencakup banyak institusi paling terkemuka di bidang biologi dan teknologi: Broad Institute, Allen Institute, Arc Institute, Wellcome Sanger Institute, Human Cell Atlas, Human Protein Atlas, NVIDIA, dan Renaissance Philanthropy .
Keluarga ESM tidak dimulai di Biohub. Teknologi ini awalnya dikembangkan di laboratorium FAIR milik Meta AI, yang menerbitkan model ESM-1 pertama dan merilis ESMFold asli di jurnal Science pada tahun 2023, menghasilkan prediksi struktur protein pertama yang berjumlah lebih dari 600 juta . Pekerjaan itu menghasilkan ESM Metagenomic Atlas yang asli, yang pada saat itu merupakan basis data struktur prediksi resolusi tinggi terbesar, kira-kira tiga kali lebih besar dari basis data struktur protein manapun yang ada
.
Ketika EvolutionaryScale, perusahaan rintisan yang dibentuk oleh tim ESM asli dari FAIR, memisahkan diri dari Meta, Biohub menyerap dan melanjutkan riset ini. Rilis generasi keempat ini dibangun langsung di atas fondasi tersebut, dengan Biohub kini memimpin pengembangan sebagai usaha sains filantropis yang bersifat terbuka .
Para periset dapat mencoba dan menggunakan perangkat ini melalui berbagai platform:
esm3-sm-open-v1 dan ESMC 600M dihosting di huggingface.co/biohub/ di bawah lisensi non-komersial biohub.org/ai-models untuk menjelajahi dan mengunduh model
Comments
0 comments