AI 에이전트와 인간의 전문 지식을 활용하여 연구자들이 진화하는 SARS-CoV-2 변종에 맞서기 위한 혁신적인 나노바디 설계를 가속화함.
최근 bioRxiv 사전 인쇄 서버에 게시된 연구에서 스탠포드 대학교와 찬 주커버그 바이오허브의 연구자들은 SARS-CoV-2의 변종을 겨냥한 나노바디 결합제를 설계하기 위해 인공지능과 인간의 협업인 '가상 실험실'을 만들었음.
그들은 가상 실험실이 92개의 새로운 나노바디를 성공적으로 설계했으며, 그 중 두 개는 최근 SARS-CoV-2 변종인 JN.1과 KP.3에 대한 결합력이 향상된 것으로 나타났음. 이는 추가 조사를 위한 유망한 후보로 작용함.
배경
학제 간 과학 연구는 다양한 분야의 전문가 간 협력이 필요하지만, 대규모 팀을 조정하는 것은 특히 자원이 부족한 그룹에게 도전이 될 수 있음.
ChatGPT와 Claude와 같은 대형 언어 모델(LLMs)은 연구자들이 과학적 질문에 답하고, 논문을 요약하며, 코드를 작성하는 등의 다양한 작업을 지원하는 데 인기를 끌고 있음.
LLMs는 특정 작업에 대한 큰 잠재력을 보여주지만, 여러 분야에 걸친 복잡하고 개방적인 연구에서는 널리 테스트되지 않았음.
ChemCrow와 Coscientist와 같은 기존 프레임워크는 화학 및 합성 계획과 같은 특정 분야에 초점을 맞추고 있으며, AI Scientist는 전체 연구 프로세스를 다루려고 하지만 좁은 기계 학습 응용 프로그램에 한정되어 있음.
이러한 노력은 종종 실제 검증이 부족하고, 여러 분야에 걸친 다단계 추론이 필요한 학제 간 연구의 문제를 해결하지 못해 자원이 부족한 그룹이 고급 과학 발견에 참여하기 어렵게 만듦.
현재 연구에서 연구자들은 복잡한 학제 간 문제를 해결하기 위해 개발된 AI-인간 협업의 새로운 프레임워크인 '가상 실험실'을 도입하고, 이를 사용하여 최신 SARS-CoV-2 변종을 겨냥한 새로운 나노바디를 설계함.
연구 개요
가상 실험실은 팀 및 개별 회의의 조합으로 구성되며, 인간 연구자가 의제를 설정하고 LLM 에이전트(예: 생물학자, 기계 학습 전문가)가 연구 목표를 달성하기 위해 전문 지식을 기여함.
연구는 적절한 과학자 에이전트를 선택하고 그들의 역할을 정의하며 전체 프로세스를 지시하는 주 연구자(PI) 에이전트에 의해 안내됨.
팀 회의에서는 모든 에이전트가 광범위한 연구 주제에 대해 논의하고, 그들의 의견은 PI에 의해 종합되어 의사 결정을 안내함. 보다 구체적인 작업을 위해서는 개별 회의가 열리며, 종종 과학 비평가 에이전트의 피드백을 받음.
각 에이전트는 제목, 전문 지식, 목표 및 역할로 정의되어 있으며, 복잡한 연구 질문을 구조화된 방식으로 해결하기 위해 협력함. 필요할 경우 여러 차례의 논의가 진행됨.
가상 실험실의 실제 적용 예는 SARS-CoV-2 바이러스에 맞서기 위한 나노바디 설계임.
PI 에이전트는 팀(예: 면역학자, 기계 학습 전문가)을 구성하여 프로젝트 방향을 지정하고, 계산 도구(예: ESM, AlphaFold-Multimer, Rosetta)를 선택하고, 이러한 도구를 사용하여 나노바디를 설계함.
이 도구들은 로그 우도 분석, 구조 예측 및 결합 에너지 계산과 같은 다양한 프로세스를 통해 나노바디 서열을 최적화하는 데 도움을 줌.
각 단계는 관련 에이전트와의 개별 회의를 통해 구현되며, 이후 고품질 결과를 보장하기 위해 병합 회의가 진행됨.
결과 및 논의
가상 실험실은 SARS-CoV-2의 KP.3 변종을 겨냥한 개선된 나노바디 후보를 설계하기 위해 상세한 계산 작업 흐름을 수행함.
이 작업 흐름은 Ty1, H11-D4, Nb21 및 VHH-72의 네 가지 시작 나노바디에 대해 여러 차례의 돌연변이 및 분석을 포함함. 각 라운드는 ESM 로그 우도 비율(LLR), AlphaFold 인터페이스 신뢰도(ipLDDT) 및 Rosetta 결합 에너지(dG)와 같은 특정 점수 메트릭에 의해 안내된 돌연변이를 도입하여 나노바디를 정제함.
이러한 메트릭은 최상위 돌연변이 서열을 식별하는 데 도움을 주었으며, 이후 실험적으로 검증됨.
이 과정은 야생형 나노바디를 평가하는 것으로 시작되었고, 이후 점진적으로 점 돌연변이를 도입하며 개선된 구조적 결합을 예측하기 위해 계산 도구를 적용함.
네 번의 라운드 후, 결합 가중 점수(WS)를 기반으로 최상의 서열이 실험적 검증을 위해 선택됨.
결과는 돌연변이 과정이 결합 친화도 및 구조적 안정성 측면에서 나노바디의 품질을 일관되게 향상시켰음을 보여줌.
선택된 92개의 돌연변이 나노바디의 실험적 검증 결과, 38%가 E. coli에서 높은 발현 수준을 보였으며, 85%가 우한 수용체 결합 도메인(RBD) 단백질에 대한 결합이 향상됨을 나타냄.
특히, 두 개의 새로운 돌연변이는 R37Q 및 L59E와 같은 특정 돌연변이 덕분에 JN.1 및 KP.3 RBD와의 결합을 보여주었으며, 이는 전기적 상호작용 및 수소 결합을 향상시켰을 가능성이 있음.
가상 실험실의 작업 흐름은 최소한의 인간 입력으로 진행되었으며, 대부분의 작업은 LLM 에이전트에 의해 생성됨. 에이전트들은 주 연구자의 안내 아래 학제 간 팀으로 협력함.
병행 회의와 과학 비평가의 입력은 출력의 품질을 향상시켜, 나노바디 설계와 같은 복잡한 프로젝트의 신속하고 강력한 과학적 발견을 위한 이 협력적 접근 방식의 힘을 입증함.
결론
결론적으로, 구식 LLM 훈련 데이터, 불완전한 도구 및 프롬프트 엔지니어링 문제에 제약을 받지만, 가상 실험실은 AI 에이전트와 인간 전문 지식을 원활하게 통합하여 학제 간 연구에 대한 혁신적인 접근 방식을 보여주며, 더 빠르고 효율적인 과학적 발견을 가능하게 함.
연구자들은 LLM이 발전함에 따라 이 프레임워크의 학제 간 연구 추진 효과가 더욱 향상될 것으로 예상하며, 생물학적 연구를 넘어선 응용으로 확장될 가능성이 있다고 언급함.