ESM 아틀라스는 극적으로 확장되었다. 메타 FAIR의 초기 ESM 메타지노믹 아틀라스가 약 6억 개의 단백질 구조를 담고 있었다면, Biohub가 새롭게 업데이트한 아틀라스는 이제 68억 개의 단백질을 기록하고 11억 개의 예측 구조를 포함한다. 이는 한 차원 높은 규모의 확장으로, 훨씬 더 광대한 단백질 우주에 대한 구조적 탐색 기회를 제공한다 .
추가로, esm3-sm-open-v1이라는 생성형 모델도 공개되었다. 이 모델은 27억 8,000만 개의 자연 단백질로 훈련되었으며, 합성 데이터를 통해 31억 5,000만 개의 서열, 2억 3,600만 개의 구조, 5억 3,900만 개의 기능 주석 데이터로 보강되어 총 7,710억 개의 토큰으로 학습되었다 . 이 모델은 학계 및 비영리 기관의 연구를 위해 비상업적 라이선스로 제공된다
.
실질적인 장점은 속도와 규모다. 치료용 단백질 결합체를 설계하고 검증하는 데 전통적으로 수개월에서 수년이 걸리던 반복적인 습식 실험(wet-lab) 작업을, Biohub의 도구들은 세 가지 핵심 능력을 통해 수주 또는 수일로 압축할 수 있게 한다.
AI가 설계한 단백질에 대한 오랜 비판 중 하나는 컴퓨터 화면에서는 그럴듯해 보이지만 실험실에서는 실패한다는 점이었다. Biohub는 이번 결과가 그렇지 않다고 보고한다. 컴퓨터 시뮬레이션만으로 설계된 결합체들이 실제 실험실 환경에서 성공적으로 의도한 표적에 결합했음이 검증되었다 .
Biohub의 과학 책임자인 알렉스 라이브스(Alex Rives)는 “이 모델들은 생물학적 과정에 대한 매우 정밀한 표상을 습득했으며, 그 결과 컴퓨터로 설계한 단백질 인터페이스를 실험실에서 테스트했을 때 예상된 결과를 얻을 수 있었다”고 밝혔다 . 이 말은 모델이 반복적인 습식 실험 최적화 없이도 기능적인 설계를 만들어낼 수 있을 만큼 충분한 기초 생물학 지식을 포착했다는 것을 의미한다.
2026년 4월 29일, Biohub는 인간 세포의 AI 기반 예측 모델을 구축하기 위해 필요한 멀티모달 데이터셋과 기술을 만드는 5개년 계획인 **가상 생물학 이니셔티브(Virtual Biology Initiative)**를 발표했다 . 총 5억 달러 중 1억 달러는 전 세계적인 데이터 생성 노력을 조정하는 데 할당되고, 4억 달러는 대규모 데이터 생성 및 차세대 측정·이미징·생물학 공학 기술 개발에 투입된다
.
이번 단백질 생물학 공개는 가상 생물학 이니셔티브의 첫 번째 주요 과학적 산출물이다. 이니셔티브의 파트너로는 브로드 연구소(Broad Institute), 앨런 연구소(Allen Institute), 아크 연구소(Arc Institute), 웰컴 생어 연구소(Wellcome Sanger Institute), 인간 세포 아틀라스(Human Cell Atlas), 인간 단백질 아틀라스(Human Protein Atlas), 엔비디아(NVIDIA), 르네상스 필란트로피(Renaissance Philanthropy) 등 생물학 및 기술 분야의 세계적 기관들이 대거 참여하고 있다 .
ESM 계열 모델의 시작은 Biohub가 아니다. 원래 이 연구는 메타 AI의 FAIR 연구소에서 시작되었다. FAIR는 최초의 ESM-1 모델들을 발표하고, 2023년에는 Science 학술지에 최초의 ESMFold를 발표하여 6억 개 이상의 단백질 구조 예측을 최초로 생성했다 . 이 연구로 탄생한 최초의 ESM 메타지노믹 아틀라스는 당시 기존의 어떤 단백질 구조 데이터베이스보다도 3배 가량 큰 최대 규모의 고해상도 예측 구조 데이터베이스였다
.
FAIR의 초기 ESM팀이 구성한 스타트업 에볼루셔너리스케일(EvolutionaryScale)이 메타에서 분사하면서, Biohub가 이 연구를 흡수하여 지속하게 되었다. 이번 4세대 공개는 그 연장선 위에 있으며, 현재 Biohub가 오픈 박애주의적 과학 벤처로서 개발을 주도하고 있다 .
연구자들은 다양한 플랫폼에서 이 도구들을 실험하고 배포할 수 있다.
esm3-sm-open-v1 및 ESMC 600M의 모델 가중치가 비상업적 라이선스로 huggingface.co/biohub/에 호스팅되어 있다 biohub.org/ai-models에서 접근할 수 있다
Comments
0 comments