생명공학자, 컴퓨터 과학자, AI 전문가로 구성된 팀이 아크 연구소와 스탠포드 대학교에서 협력하여 유전적 서열을 해독하고 설계할 수 있는 AI 기반 모델을 개발함.
그들의 연구 논문은 저널 Science에 발표되었으며, 이 그룹은 혁신적인 모델을 설계하고 구축하는 데 필요한 요소들을 설명함.
모델의 여러 가능한 용도를 나열하면서 연구자들은 이를 Evo라고 명명함. 한편, 글래드스톤 심혈관 질환 연구소의 크리스티나 시어도리스는 Evo의 개발이 의학 연구와 여러 질병 치료에 중대한 영향을 미칠 수 있다고 제안하는 관점 기사를 발표함.
Evo는 세포 기능을 조작하고 새로운 유전자를 생성하며, 완전히 새로운 CRISPR 유전자 편집 시스템을 개발할 수 있는 DNA 서열을 설계할 수 있음. 연구 논문에 따르면, 이 “다중 모달 기계 학습 모델”은 “2.7백만 개의 진화적으로 다양한 미생물 유전체”를 기반으로 DNA, RNA 및 단백질 서열을 분자에서 유전체 규모까지 해독하고 설계하는 데 비할 데 없는 정확성을 자랑함.
생물학의 '로제타 스톤'
이 모델은 DNA를 설계하기 위해 훈련된 첫 번째 기초 모델임. 아크 연구소는 이를 생물학의 “로제타 스톤”으로 설명함.
논문에 따르면, Evo는 깊은 학습 기술을 사용하여 긴 유전 데이터 서열을 효율적으로 처리함. 이를 통해 유전 코드의 상호작용을 이해할 수 있음. 이 모델은 작은 DNA 변화가 유기체의 진화적 적합성에 미치는 영향을 예측하고, 이전 모델을 크게 초월하는 1메가베이스 이상의 현실적인 유전체 길이 서열을 생성할 수 있음.
연구에 따르면, Evo는 70억 개의 매개변수를 갖추고 있으며, 단일 뉴클레오타이드 해상도로 생물학적 서열을 모델링하기 위해 최첨단 깊은 학습 아키텍처를 사용함.
“Evo와 같은 대규모 생물학적 서열 모델의 추가 개발은 DNA 합성과 유전체 공학의 발전과 결합하여 생명 공학의 능력을 가속화할 것”이라고 연구자들은 결론지음.