미국의 연구자들이 최근 Scientific Reports 저널에 발표한 연구에서, 인공지능(AI) 모델을 개발하여 인지적으로 정상인들의 알츠하이머병(AD) 진행을 분석함. 이 모델은 합성곱 신경망(CNN)과 장단기 기억 네트워크(LSTM)를 포함한 고급 신경망 아키텍처를 사용하여 다중 모달 데이터를 처리하고 AD 진행을 예측함. 연구진은 느린 진행, 중간 진행, 빠른 진행, 비진행자로 나뉜 네 가지 주요 진행 클러스터를 발견했으며, 이 패턴은 인종과 성별에 따라 다름. 이 모델은 단일 모달 모델보다 성능이 뛰어나고, 질병 진행의 중요한 다양한 예측 변수를 식별함.
AD는 인지, 기억 및 행동에 영향을 미치며, 조기 발견이 치료 결과를 최적화하는 데 중요함. 현재 연구는 주로 경도 인지 장애(MCI) 또는 고급 증상을 가진 개인을 대상으로 하며, AD 진행 위험이 있는 정상 인지 개인에 대한 연구는 거의 없음. 특히 히스패닉/라틴계 및 흑인/아프리카계 미국인들은 AD 위험이 더 높지만 임상 시험에 덜 포함됨. 이러한 격차의 원인으로는 불신, 사회경제적 장벽, 물류적 문제 등이 있으며, 이는 다양한 인구에서 데이터 수집을 복잡하게 만듦. 기계 학습은 질병 진행 예측을 위해 신경학에서 점점 더 많이 사용되고 있으며, 이는 조기 발견 및 개입을 가능하게 함. 그러나 기존 모델은 생물 의학 데이터의 복잡하고 고차원적인 특성을 관리하는 데 어려움을 겪음. 확장 가능한 딥러닝 모델은 다양한 위험 요소 간의 패턴을 식별하는 데 더 적합하여 AD 위험 예측을 향상시키고 공정하고 포괄적인 AD 연구를 지원할 수 있음. 이러한 문제를 염두에 두고, 연구자들은 AD 진행을 예측하기 위해 다중 헤드 딥러닝 모델을 개발하고, 주요 예측 변수를 식별하고 참가자를 클러스터링하여 인구 수준의 이질성을 포착함.
연구자들은 National Alzheimer’s Coordinating Center(NACC)에서 포괄적이고 고차원적인 데이터를 활용하여 다중 헤드 예측 딥러닝 모델을 구축함. 이 모델은 대규모 데이터 세트를 처리하도록 독특하게 구조화되어 있으며, 생물 의학 및 이미징 데이터를 결합하여 AD 진행 예측, 클러스터링 및 특징 추출을 향상시킴. 데이터 정제를 위한 광범위한 전처리가 적용되어 잠재적 편향을 완화하고, 6,110명의 참가자와 다양한 도메인에서 447개의 특징을 포함함. 참가자의 약 63%가 여성, 87%가 백인(5%는 히스패닉/라틴계 포함), 13%가 흑인 또는 아프리카계 미국인임. 대부분의 참가자는 초기 방문 시 61세 이상으로, 이 연령대에 대한 상당한 데이터 세트를 제공함.
다중 헤드 신경망 모델은 다중 모달 데이터와 융합 전략을 사용하여 복잡한 상호작용을 학습하고 구별함. 이 접근 방식은 CNN, LSTM 및 XGBoost 모델을 독특하게 결합하여 장기 데이터를 포착하고 질병 진행을 높은 정확도로 예측함. 추가 분석에는 SHAP 기반 특징 추출 및 클러스터링이 포함되어 있으며, 임상 치매 등급, 뇌졸중, 우울증 및 당뇨병과 같은 질병 진행의 주요 예측 변수를 식별하고 인구 이질성을 검증함.
참가자의 약 61%는 위험 유전자 아포리포단백질 E4(APOE4) 대립유전자가 없었고, 27%는 1개 복사본, 3%는 2개 복사본을 가짐. 다중 모달, 다중 헤드, 조기 융합, 두 개의 층 CNN 모델은 정확도, 정밀도, 재현율 및 F1 점수와 같은 주요 지표에서 14개의 단일 모달 모델보다 우수함을 입증하며, 불균형 클래스의 강력한 패턴 인식 및 예측을 보여줌.
참가자는 진행 속도에 따라 비진행자(80%), 느린 진행자(14%), 중간 진행자(4%), 빠른 진행자(2%)로 분류됨. 흑인/아프리카계 미국인 참가자, 특히 여성은 백인 참가자보다 더 빠른 질병 진행과 더 큰 변동성을 보임. 특히 빠른 진행자 그룹의 흑인/아프리카계 미국인 여성은 MCI 단계를 건너뛰고 직접 치매로 진행되었으며, 백인 여성은 중간 MCI 단계를 경험하는 경향이 있음. 이 경향은 인종과 성별이 AD 진행에 미치는 영향을 강조하며, 흑인/아프리카계 미국인 여성은 모든 클러스터에서 더 이른 질병 발병과 더 큰 변동성을 보임. MRI 기반 예측 변수는 영향력이 있지만, MCI/치매로의 특정 전환 예측에서는 낮은 순위를 차지함.
결론적으로, 이 연구는 다중 헤드 딥러닝 모델이 AD의 복잡성을 효과적으로 해결할 수 있음을 성공적으로 입증하며, 진행 클러스터 간의 중요한 이질성을 발견하고 인구 통계가 질병 진행에 미치는 영향을 새롭게 조명함. 흑인/아프리카계 미국인 참가자, 특히 여성은 백인 참가자보다 더 이른 질병 진행을 보임. 앞으로 이 접근 방식은 가장 높은 위험에 처한 사람들을 위한 표적 선별 방법 개발을 지원할 수 있음.