ESMFold2 هو محرك التنبؤ بالبنية ضمن بنية ESM3. يتنبأ بالبنى البروتينية على المستوى الذري مباشرة من بيانات التسلسل بسرعة ودقة فائقتين، دون الحاجة إلى تقنيات محاذاة التسلسل المتعدد التي كانت تُبطئ الأساليب التقليدية . هذه السرعة هي ما يجعل التغطية البنيوية واسعة النطاق عملية وممكنة.
أطلس ESM تم توسيعه بشكل كبير. كان أطلس ESM الميتاجينومي الأصلي الصادر عن Meta FAIR يغطي حوالي 600 مليون بنية بروتينية . أما أطلس Biohub المُحدّث فيرسم الآن خرائط لـ 6.8 مليار بروتين مع 1.1 مليار بنية متوقعة، وهو توسع هائل في الحجم يوفر تغطية بنيوية لجزء أكبر بكثير من كون البروتين
.
بالإضافة إلى ذلك، يشمل الإصدار esm3-sm-open-v1، وهو نموذج توليدي تم تدريبه على 2.78 مليار بروتين طبيعي مع تعزيزه ببيانات تركيبية ليصل إلى 3.15 مليار تسلسل، و 236 مليون بنية، و 539 مليون تعليق توضيحي للوظائف، بإجمالي 771 مليار وحدة رمزية (token) . صدر هذا النموذج بموجب ترخيص غير تجاري للاستخدام الأكاديمي وغير الربحي
.
الميزة العملية لهذه الأدوات هي السرعة والنطاق. عادةً ما يستغرق تصميم الروابط البروتينية العلاجية والتحقق من صحتها شهوراً أو سنوات من العمل المخبري الرطب التكراري. تختصر أدوات Biohub هذه المدة إلى أسابيع أو أيام من خلال تمكين ثلاث قدرات:
ثمة انتقاد متكرر للبروتينات المصممة بالذكاء الاصطناعي وهو أنها تبدو جيدة على الحاسوب ولكنها تفشل في المختبر. تفيد Biohub أن الأمر ليس كذلك هنا. فقد تم التحقق من صحة الروابط المصممة بالكامل داخل الحاسوب باستخدام هذه النماذج في تجارب مخبرية حقيقية – أي أن البروتينات المصممة بالذكاء الاصطناعي ارتبطت فعلاً بأهدافها .
صرّح أليكس ريفز، رئيس قسم العلوم في Biohub، بأن "هذه النماذج اكتسبت تمثيلاً دقيقاً للغاية للعمليات البيولوجية لدرجة أنها تسمح بالتصميم الحاسوبي لواجهات البروتين، والتي يمكن بعد ذلك اختبارها في المختبر مع الحصول على النتائج المتوقعة" . هذا يعني أن النماذج استحوذت على ما يكفي من البيولوجيا الأساسية لإنتاج تصاميم وظيفية دون الحاجة إلى تحسين مخبري رطب تكراري.
في 29 أبريل 2026، أعلنت Biohub عن مبادرة البيولوجيا الافتراضية (Virtual Biology Initiative)، وهو التزام مدته خمس سنوات بقيمة 500 مليون دولار لبناء مجموعات البيانات متعددة الوسائط ونماذج الذكاء الاصطناعي اللازمة لنماذج تنبؤية للخلايا البشرية . من هذا التمويل، تم تخصيص 100 مليون دولار لتنسيق جهود عالمية لتوليد البيانات، و 400 مليون دولار لتوليد البيانات على نطاق واسع وتطوير تقنيات الجيل التالي لقياس وتصوير وهندسة البيولوجيا
.
إصدار بيولوجيا البروتين هذا هو أول ناتج علمي كبير في إطار مبادرة VBI. يضم شركاء المبادرة العديد من أبرز المؤسسات في مجالي البيولوجيا والتكنولوجيا: معهد برود (Broad Institute)، ومعهد ألين (Allen Institute)، ومعهد آرك (Arc Institute)، ومعهد ويلكوم سانجر (Wellcome Sanger Institute)، وأطلس الخلية البشرية (Human Cell Atlas)، وأطلس البروتين البشري (Human Protein Atlas)، وشركة NVIDIA، ومؤسسة رينيسانس الخيرية (Renaissance Philanthropy) .
لم تبدأ عائلة نماذج ESM في Biohub. لقد طُورت في الأصل في مختبر FAIR التابع لشركة Meta AI، الذي نشر أول نماذج ESM-1 وأصدر نموذج ESMFold الأصلي في مجلة Science عام 2023، مولّداً أول 600 مليون توقع لبنية البروتين . أنتج هذا العمل أطلس ESM الميتاجينومي الأصلي، الذي كان في ذلك الوقت أكبر قاعدة بيانات للبنى المتوقعة عالية الدقة، أكبر بثلاث مرات تقريباً من أي قاعدة بيانات بنيوية بروتينية موجودة
.
عندما انبثقت شركة EvolutionaryScale، وهي الشركة الناشئة التي شكلها فريق ESM الأصلي في FAIR، من Meta، استوعبت Biohub البحث واستمرت فيه. يبني إصدار الجيل الرابع هذا مباشرة على هذا الإرث، حيث تقود Biohub الآن التطوير كمشروع علمي خيري مفتوح .
يمكن للباحثين تجربة هذه الأدوات ونشرها عبر منصات متعددة:
esm3-sm-open-v1 و ESMC 600M مستضافة على huggingface.co/biohub/ بموجب ترخيص غير تجاري biohub.org/ai-models لاستكشاف وتحميل النماذج
Comments
0 comments