인공지능이 발전함에 따라, 실제 응용에서의 사용과 능력이 인간의 전문성을 초월할 수 있는 새로운 경지에 도달하고 있음.
정확한 진단이 적절한 환자 치료를 보장하는 방사선학 분야에서, ChatGPT와 같은 대형 언어 모델이 정확성을 향상시키거나 최소한 좋은 제2의 의견을 제공할 수 있음.
오사카 메트로폴리탄 대학교 의학 대학원에서 대학원생 미츠야마 야스히토와 부교수 우에다 다이지의 팀이 연구자들을 이끌고, GPT-4 기반의 ChatGPT와 방사선 전문의의 진단 성능을 150개의 수술 전 뇌종양 MRI 보고서에서 비교함.
일본어로 작성된 이러한 일상적인 임상 노트를 바탕으로, ChatGPT와 두 명의 보드 인증 신경 방사선 전문의, 세 명의 일반 방사선 전문의가 감별 진단과 최종 진단을 제공하도록 요청받음.
그 후, 종양 제거 후 실제 진단을 바탕으로 정확도가 계산됨. 결과는 ChatGPT가 73%, 신경 방사선 전문의 평균 72%, 일반 방사선 전문의 평균 68%로 나타남. 또한, ChatGPT의 최종 진단 정확도는 임상 보고서가 신경 방사선 전문의에 의해 작성되었는지 일반 방사선 전문의에 의해 작성되었는지에 따라 달라짐. 신경 방사선 전문의 보고서의 정확도는 80%였고, 일반 방사선 전문의 보고서의 경우 60%였음.
"이 결과는 ChatGPT가 뇌종양의 수술 전 MRI 진단에 유용할 수 있음을 시사함"이라고 대학원생 미츠야마가 말함.