연구: 포도당 패턴에서 건강 결과로: 지속적인 포도당 모니터 데이터 분석을 위한 일반화 가능한 기초 모델. 이미지 출처: Orawan Pattarawimonchai / Shutterstock
*중요 공지: arXiv는 동료 검토되지 않은 초기 과학 보고서를 게시하며, 따라서 결론으로 간주되거나 임상 실습/건강 관련 행동을 안내하는 데 사용되거나 확립된 정보로 취급되어서는 안 됨.*
GluFormer는 CGM 데이터로 훈련된 변환기 기반 생성 모델로, 다양한 인구와 조건에서 광범위한 건강 결과와 미래 위험을 예측하는 데 있어 전통적인 분석 도구보다 우수한 성능을 보임.
최근 이스라엘의 과학자들이 지속적인 포도당 모니터링 데이터 분석 및 혈당 패턴 예측을 위한 변환기 아키텍처 기반 생성 모델을 arXiv* 사전 인쇄* 서버에 발표함. 이 모델은 위험 분류, 당뇨병 관리 및 치료 전략 최적화에 응용될 수 있음.
배경
당뇨병은 전 세계적으로 5억 명 이상의 개인에게 영향을 미치고 매년 9천억 달러 이상의 비용이 드는 글로벌 건강 위기가 됨. 제2형 당뇨병은 식단 및 신체 활동 수준을 포함한 수많은 수정 가능한 위험 요소가 있지만, 정신 건강 문제, 신장 질환 및 심혈관 질환과 같은 다른 동반 질환의 위험도 증가시킴.
지속적인 포도당 모니터링(CGM) 장치는 혈당 사건의 빈도를 줄이고 혈당 조절을 개선하며 전반적인 삶의 질을 향상시키는 데 중요한 역할을 함. 지속적인 포도당 모니터링은 또한 포도당 조절 장애를 조기에 감지하고 개인화된 식이 선택을 하는 데 사용되고 있음.
동시에 의료 인공지능(AI) 분야는 CGM 장치에서 수집된 대량의 비표시 데이터 분석을 위한 자기 지도 학습으로 발전하고 있음. 훈련된 자기 지도 학습 모델은 질병을 감지하기 위해 웨어러블 및 조직병리학적 및 망막 이미지를 스캔하는 데 효과적으로 사용되고 있음.
연구 개요
현재 연구에서 연구자들은 다양한 인구의 대량 CGM 데이터를 분석할 수 있는 변환기 아키텍처 기반 생성 모델인 GluFormer의 개발을 설명함. 이 모델은 처음에 인간 표현형 프로젝트에 등록된 비당뇨 참가자의 CGM 데이터로 훈련됨. 이 데이터 세트는 10,000명의 참가자로부터 1천만 개 이상의 포도당 측정값으로 구성됨. 각 측정값은 개별 토큰으로 처리되어 다음 토큰 예측 방법을 사용하여 모델을 효율적으로 훈련하는 데 사용됨. 이 훈련 방법은 GluFormer가 CGM 시계열을 생성하고 확장할 수 있도록 함.
또한, 자기 지도 학습을 사용하여 모델을 사전 훈련함으로써 비표시 데이터에서 학습할 수 있게 되어 CGM 데이터의 복잡한 패턴을 포착하는 GluFormer의 능력이 향상됨.
모델의 현실적인 CGM 신호 생성 능력은 포도당 관리 지표 및 평균 포도당 수치와 같은 주요 혈당 지표를 사용하여 정량적 비교 및 시각적 검사를 통해 테스트되고 검증됨.
연구자들은 모델의 일반화 가능성을 다양한 혈당 특성을 가진 검증 집단과 다양한 지리적 위치에서 적용함. 이 집단에는 임신성 당뇨병 및 제2형 당뇨병 환자가 포함됨.
GluFormer는 또한 다양한 CGM 장치 및 다양한 기저 질환의 데이터를 적용하여 다양한 시나리오에서의 강인성을 테스트함. 연구는 또한 다층 퍼셉트론 및 합성곱 신경망과 같은 다른 AI 기반 모델과의 임상 결과 예측 성능을 비교함.
또한 연구자들은 CGM 데이터와 함께 식이 섭취에 대한 데이터를 통합하여 특정 음식에 대한 포도당 반응에 중점을 두고 예측 정확도를 향상시킬 수 있는 다중 모드 버전의 GluFormer를 생성함. 연구자들은 또한 시간, 날짜 및 월과 같은 시간 정보를 GluFormer 모델에 통합하여 하루 동안의 포도당 수치의 시간적 변동을 포착함.
결과
결과는 GluFormer가 다양한 인구의 CGM 데이터를 분석하고 예측할 수 있는 능력을 보여주었으며, CGM 데이터의 역학을 이해하는 데 기여함. 균일 매니폴드 근사 및 투영(UMAP)을 사용하여 GluFormer의 관련 데이터 포착 능력을 테스트했으며, 연구는 임상적으로 중요한 포도당 내성 및 혈당 조절 정보를 보여주는 임베딩 패턴을 발견함.
모델은 CGM 데이터에서 개별 특정 패턴을 정확하게 식별할 수 있었음. GluFormer의 헤모글로빈 A1C 수치 예측 성능은 다층 퍼셉트론 및 합성곱 신경망을 초월하였으며, 모델은 표준 임상 측정보다 더 정확한 예측을 제공함.
또한, 임신성 당뇨병 및 제2형 당뇨병 환자를 포함한 집단에서 모델이 테스트되었을 때, 상관관계가 있는 혈당 지표 측정값과 함께 현실적인 CGM 신호가 생성되어 모델의 강력한 예측 능력을 뒷받침함.
또한, 식이 데이터가 통합된 GluFormer의 다중 모드 버전은 특히 식사 시간에 관찰된 CGM 데이터와의 상관관계가 더 높아져 모델의 예측 정확도를 향상시킴. 시간 정보를 추가함으로써 모델은 하루 동안 포도당 수치의 시간적 변화를 정확하게 반영할 수 있는 CGM 데이터를 생성하는 능력이 더욱 향상됨.
결론
전반적으로 연구는 자기 지도 학습을 통해 훈련된 변환기 아키텍처 기반 모델인 GluFormer가 다양한 대사 특성과 지리적 특성을 가진 인구에서 CGM 데이터 및 혈당 결과를 예측하는 데 높은 정확성을 보였음을 발견함. 이 모델은 다른 AI 기반 모델보다 우수한 성능을 보였으며, 모델의 다중 모드 버전에서 식이 데이터의 통합은 예측 능력과 정확성을 향상시켰음. 이러한 발견은 만성 질환 관리에서 GluFormer의 유용성을 강조함.