란셋 디지털헬스에 다기관 전향적 대조 임상 결과 게재
진단 자체는 이미 전문의 수준…치료 결정은 의사 '우위'
휴대전화 기반의 피부암 진단 인공지능(AI)이 진단 기능 자체만 보면 피부과 전공의 등 초보 의사보다는 낫다는 연구 결과가 나왔다.
진단 정확도 측면에서 경험 많은 전문의 수준을 보여준 것. 하지만 치료 결정 부분에 있어서는 전문의에 비해 능력이 현저하게 떨어졌다.
현지시각으로 23일 란셋 디지털헬스에는 피부암 치료에 있어 진단 보조 AI의 유효성에 대한 연구 결과가 게재됐다(doi.org/10.1016/S2589-7500(23)00130-9).
현재 X레이나 CT 등의 영상을 활용한 진단 보조 인공지능은 고도화를 거치며 속속 상용화 단계에 이르고 있다.
특히 웨어러블 기기나 휴대전화 등을 활용해 접근성을 높이기 위한 시도도 이어지고 있는 것이 사실.
이번 연구에 활용된 휴대전화 기반 피부암 진단 인공지능 또한 마찬가지다. 휴대전화 사진만으로 피부암 진단이 일정 부분 가능하다는 점에서 기대를 모으고 있는 셈이다.
하지만 실제 임상 현장에서 이러한 인공지능이 얼마나 유효성을 가지는지에 대해서는 아직까지 근거가 부족한 것이 사실이다.
시드니 의과대학 스코트(Scott W Menzies) 교수가 이끄는 연구진이 실제 임상 의사와 비교해 인공지능이 얼마나 효과적인지를 비교하는 연구를 진행한 배경도 여기에 있다.
이에 따라 연구진은 두가지의 피부암 진단 인공지능과 경험 많은 피부과 전문의, 또한 피부과 전공의를 대상으로 실제 피부암 진단에 얼마나 차이가 있는지를 비교 분석했다.
일단 시나리오 A에서는 124명의 환자에게서 172개의 의심스러운 색소 병변(이 중 84개가 악성)을 주고 인공지능과 임상 의사를 비교했다.
또한 시나리오 B에서는 66명의 환자에게서 5696개의 의심스러운 색소 병변(이중 18개가 악성)을 주고 대조해 분석했다.
그 결과 인공지능은 피부과 레지던트와 비교해 진단 기능면에서는 월등이 우수했다. 절대 정확도가 1.2% 차이가 난 것. 또한 경험 많은 피부과 전문의와 비교할때도 진단 기능면에서는 전혀 뒤떨어지지 않았다.
하지만 종양 제거 등 치료 결정 등의 정확도에 있어서는 그 기능이 현저하게 떨어졌다. 올바른 치료 방식을 결정하는가에 대한 절대 정확도에서 전문가에 비해 0.5%가 뒤쳐졌기 때문이다. 그러나 이마저도 피부과 전공의와 비교하면 0.4% 우위를 보였다.
결국 진단 기능 그 자체만으로는 피부과 전공의를 능가하고 전문의와 동등한 수준이며 치료 결정면에서는 전문의보다는 떨어지지만 전공의보다는 낫다는 결론이 나온 셈이다.
스코트 교수는 "7등급 인공지능의 경우 진단 기능면에서는 전문의와 동등하며 치료 결정 측면에서도 전문의보다는 열등하지만 전공의보다는 우수했다"며 "인공지능이 실제 임상에서도 전문의 수준에 이른다는 것을 시사한다"고 설명했다.
이어 그는 "그러나 많은 위양성 결과 등 아직까지는 고려해야 할 점이 있는 것은 사실"이라며 "이러한 부분만 염두에 둔다면 인공지능은 이미 실제 임상에서 활용 가능한 수준에 이르렀다"고 밝혔다.