진단 결정을 내릴 때 방사선과 의사와 다른 의사들이 X선에서 특정 관심 영역을 지적하는 인공지능(AI)에 지나치게 의존할 수 있다는 연구 결과가 오늘 방사선학 저널에 발표됨.
"2022년 기준으로 미국 식품의약국(FDA)에서 190개의 방사선 AI 소프트웨어 프로그램이 승인되었습니다,"라고 연구의 수석 저자 중 한 명인 Paul H. Yi 박사가 말함. 그는 멤피스에 있는 세인트 주드 아동 연구 병원의 방사선학과에서 지능형 이미징 정보학을 담당하고 있는 부교수임. "하지만 AI 개념 증명과 실제 임상 사용 간의 격차가 나타났습니다. 이 격차를 해소하기 위해서는 AI 조언에 대한 적절한 신뢰를 키우는 것이 매우 중요합니다."
이 다기관, 전향적 연구에서 220명의 방사선과 의사와 내과/응급 의사(132명의 방사선과 의사)가 AI 조언과 함께 흉부 X선 영상을 읽음. 각 의사는 전문가의 진단 성능과 유사한 시뮬레이션 AI 보조 도구의 조언과 함께 8개의 흉부 X선 사례를 평가하는 임무를 맡음. 임상 사례는 보스턴의 베스 이스라엘 디컨네스 병원에서 MIMI 흉부 X선 데이터베이스를 통해 얻은 정면 및 가능할 경우 측면 흉부 X선 이미지를 제공함. 방사선과 의사 패널이 실제 임상 실습을 시뮬레이션한 사례 세트를 선택함.
각 사례에 대해 참가자들은 환자의 임상 이력, AI 조언 및 X선 이미지를 제시받음. AI는 올바른 진단 또는 잘못된 진단을 제공하며, 지역적 또는 전반적인 설명을 제공함. 지역적 설명에서는 AI가 가장 중요한 부분으로 간주되는 이미지를 강조함. 전반적인 설명에서는 AI가 진단에 도달한 방법을 보여주기 위해 이전 사례의 유사한 이미지를 제공함.
이러한 지역적 설명은 실시간으로 의사를 문제의 영역으로 직접 안내함. 연구에서 AI는 폐렴이나 기타 이상이 있는 영역에 상자를 그려줌.
AI 조언이 올바른 경우, 리뷰어의 평균 진단 정확도는 지역적 설명에서 92.8%, 전반적 설명에서 85.3%였음. AI 조언이 잘못된 경우, 의사 정확도는 지역적 설명에서 23.6%, 전반적 설명에서 26.1%였음.
"지역적 설명이 제공될 때, 연구에 참여한 방사선과 의사와 비방사선과 의사 모두 AI 진단을 더 빨리 신뢰하는 경향이 있었음,"이라고 Yi 박사가 말함. 연구의 공동 수석 저자 Chien-Ming Huang 박사는 AI에 대한 신뢰가 과도한 의존이나 자동화 편향의 위험이 있다고 지적함. "컴퓨터가 말하는 것에 지나치게 의존하면 문제가 발생할 수 있음, 왜냐하면 AI가 항상 옳은 것은 아니기 때문임,"이라고 Yi 박사가 덧붙임. 연구에 따르면 AI 시스템 개발자는 AI 설명의 다양한 형태가 AI 조언에 대한 의존도에 미치는 영향을 신중하게 고려해야 함.
"산업과 의료 연구자 간의 협력이 핵심이라고 생각함,"이라고 그는 말함. "이 논문이 대화와 생산적인 미래 연구 협력의 시작이 되기를 희망함."