AI 모델이 구글 스트리트 뷰 이미지를 의존할 경우 환경적 특성을 잘못 해석해 비만과 당뇨병을 줄이기 위한 공공 건강 노력이 잘못될 수 있다는 새로운 연구 결과가 나옴.
최근 PNAS 환경 과학 저널에 발표된 연구에 따르면, 인공지능(AI)과 구글 스트리트 뷰(GSV) 이미지를 도시 계획에 활용하는 것이 비만과 당뇨병을 퇴치하기 위한 공공 건강 개입에 부정적인 영향을 미칠 수 있는 잘못된 결론을 초래할 수 있음.
AI는 최근 몇 년간 공공 건강과 도시 계획 같은 중요한 분야에 통합되고 있으며, 이는 지역 사회에 큰 영향을 미칠 수 있음. 예를 들어, GSV 이미지는 딥러닝을 통해 객체 감지와 결합되어 인구 조사 구역에 정의된 이웃 속성과 관련된 건강 결과를 평가하는 데 사용됨.
GSV 데이터는 식물의 종류와 도로망, 건물 구조와 같은 도시 개발 정보를 제공함. 이러한 데이터는 딥러닝을 통해 정신 및 심혈관 대사 질병, 그리고 코로나19의 유병률을 목표로 하는 지역 개입을 고안하는 데 활용됨.
하지만 AI를 사용하는 예측 모델은 편향된 데이터와 잘못된 상관관계를 식별하지 못하는 등의 문제에 직면하고 있으며, 이러한 문제는 노출과 건강 결과 간의 연관성을 매개할 수 있는 다른 요인이 있을 때 더욱 심각해짐.
이번 연구는 GSV에서 파생된 환경 특성이 뉴욕시의 비만과 당뇨병의 평균 유병률과 어떻게 상호작용하는지를 조사함. 또한 이러한 건강 상태와 신체 비활동 간의 관계를 평가함. GSV 데이터는 교차로 밀도가 높을수록 질병 유병률이 낮아진다고 나타남. 신체 활동이 비만에 미치는 영향이 당뇨병에 미치는 영향보다 더 크다는 것은 이전 GSV 기반 교차로 추정에 따라 예상된 결과임. 그러나 이전 연구와 비교했을 때, GSV의 보도 밀도와 건강 결과 간의 연관성은 관찰되지 않음.
교차로와 보도가 건강 결과에 미치는 영향은 해당 인구 조사 구역의 신체 비활동 유병률 때문임. 따라서 건축 환경 자체보다는 해당 구역의 신체 활동 수준이 건강 결과 변화를 설명함. 신체 비활동이 한 단위 줄어들 때마다 비만과 당뇨병의 유병률은 각각 4.17배와 17.2배 감소함.
GSV 특성에 기반한 추론이 이루어진 도시의 건축 환경은 현실과 일치하지 않음. 예를 들어, 보도가 다리나 고속도로 근처에 존재한다고 표시되지만 실제로는 없거나, 막힌 보도가 없다고 보고될 수 있음.
이러한 발견은 AI가 GSV에서 파생된 특성에 의존하여 건강 결과와의 연관성을 감지할 때 부정확한 개입 추정치를 생성할 수 있음을 나타냄. 따라서 모델은 구체적으로 설명되어야 하며, 이러한 특성이 효과를 발휘하는 경로를 고려해야 함. 이러한 안전 장치는 목표를 정확하게 식별하고 다양한 개입의 효능을 올바르게 추정하는 데 도움이 될 것임.
결론적으로, 이전 연구들이 지역을 비교하기 위해 질적 리뷰에 의존했던 것과 달리, 이번 연구는 처음으로 GSV 특성과 지상 현실을 비교함. 연구자들은 신체 활동과 같은 매개 요인을 보완하기 위해 인과적 프레임워크를 활용함. 이는 신체 비활동의 두 가장 낮은 구간에서 10%의 샘플이 개선될 경우 비만과 당뇨병 유병률이 각각 4.17배와 17.2배 감소할 것임을 보여줌.
그럼에도 불구하고, 데이터의 한계와 건축 환경, 개인 행동 및 결과적인 건강 결과의 변화 상태는 공공 건강 개입을 위해 이러한 유형의 데이터를 활용할 때 신중하게 명시되어야 함.