최근 질병의 진단과 치료를 목적으로 하는 의료 인공지능(AI)이 속속 임상 현장에 보급되고 있지만 대부분이 근거가 미약하다는 점에서 개선이 필요하다는 지적이 나왔다.
매우 제한된 데이터 세트로만 검증을 마친 채 곧바로 환자에게 사용되고 있다는 점에서 품질을 보장할 수 있는 지침이 필요하다는 것이 전문가들의 의견이다.
현지시각으로 19일 npj 디지털 의학(npj Digital Medicine)에는 인공지능 의료기기에 대한 체계적 검토 연구 결과가 공개됐다(10.1038/s41746-025-01726-8).
현재 인공지능 의료기기는 의료 분야에서 가장 빠르게 성장하고 있는 분야로 진단 보조부터 치료, 예측에 이르기까지 다양한 부분에서 개발이 이뤄지고 있다.
하지만 산업 육성을 위해 일정 부분의 안전성과 유효성이 보장되면 시장에 먼저 내보내는 이른바 선진입 제도가 활성화되면서 다양한 문제가 나오고 있는 것도 사실이다.
규제기관의 승인 당시에는 유효성이 입증됐지만 실제 환자에게 적용했을때 아무런 효과가 없거나 오류가 생기는 일이 지속적으로 보고되고 있기 때문이다.
유니버시티 칼리지 런던 아리엘 옹(Ariel Ong) 교수가 이끄는 연구진이 안과 영역을 중심으로 이에 대한 체계적 근거를 검토한 이유도 여기에 있다.
실제 인공지능 의료기기들이 어떠한 근거에서 승인을 받았고 또한 검증은 제대로 이뤄졌는지를 파악하기 위해서다.
이에 따라 연구진은 미국과 유럽, 호주에서 미국 식품의약국(FDA) 등이 승인한 안과 영역 인공지능 의료기기 36개를 분석했다.
그 결과 검토 대상 기기인 36개 중 19%는 승인의 기반이 된 연구가 동료 심사(Peer review)도 없이 진행된 것으로 나타났다. 말 그대로 정확도와 유효성에 대해 학자들의 검증이 없었다는 의미다.
또한 규제기관 승인의 기반이 된 연구 중 환자의 연령을 보고한 연구는 52%에 불과했으며 성별은 51%, 인종의 경우 21%에 불과했다. 범용성의 기반이 매우 허술하다는 뜻이다.
아리엘 옹 교수는 "승인된 대부분의 기기가 매우 단순한 데이터 셋으로 검증을 받았으며 특히 절반 가량이 매우 기본적인 정보인 성별과 연령 등도 분류되지 않은 데이터를 활용했다"며 "인구학적 특성에 대한 검증이 되지 않았다는 의미"라고 지적했다.
검토 결과 연구의 근거 수준 또한 상당히 부실했다. 36개 의료기기의 검증 연구 131편 중 중재적 연구가 8%에 불과했기 때문이다. 중재적 연구란 실제 임상 환경에서 기기를 시험하는 것을 의미한다.
또한 이미 출시된 의료기기 혹은 인공지능과 성능을 비교한 직접 비교 연구도 8%에 불과했고 의사가 행하는 표준 치료와 비교한 연구도 22%에 그쳤다.
아리엘 옹 교수는 "승인의 기반이 된 131건의 연구 중 중재적 연구가 불과 8% 밖에 되지 않는다는 것은 매우 놀라운 일"이라며 "동일선상에 있는 약물 등의 규제 및 심사, 근거에 비하면 말도 안되는 수준"이라고 꼬집었다.
이로 인해 이러한 인공지능 의료기기들에 대한 허가와 승인도 제각각으로 이뤄지고 있었다. 요구하는 근거 수준에 따라 허들을 넘는 국가와 그렇지 않은 국가가 극단적으로 나뉘고 있었던 것.
실제로 36개의 인공지능 의료기기 중 유럽에서는 97%가 사용 승인을 받았지만 이 기술 중 호주에서 허가를 받은 것은 22%에 불과했다. 특히 미국의 경우 이 중에서 불과 8%만이 최종 승인을 받았다.
아리엘 옹 교수는 "현재 환자 치료에 사용되는 약물 중 대다수가 미국과 유럽, 호주에서 허가를 받는 것과 비교하면 이러한 불균형은 말도 되지 않는 수준"이라며 "체계적이고 표준화된 검증 방법을 세워야 한다는 것을 시사한다"고 제언했다.
이어 그는 "특히 실제 임상 환경에서 어떻게 구동되는지를 검증한 근거가 매우 부족하다는 것은 심각한 문제"라며 "의료 인공지능 또한 약물과 마찬가지로 높은 근거 기준을 충족해야 한다는 점에서 고품질 중재 연구에 대한 지침이 시급하다"고 밝혔다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글