개인정보 보호를 위한 비밀번호 변경안내 주기적인 비밀번호 변경으로 개인정보를 지켜주세요.
안전한 개인정보 보호를 위해 3개월마다 비밀번호를 변경해주세요.
※ 비밀번호는 마이페이지에서도 변경 가능합니다.
30일간 보이지 않기
  • 의료기기·AI
  • 치료

의료 인공지능 근거 수준 참담…"중재적 연구 늘려야"

발행날짜: 2025-06-20 05:30:00

미국·유럽 등 선진국 승인 AI 기기 체계적 분석 결과
중재적 연구 불과 8% 불과…비교 연구조차 극소수

최근 질병의 진단과 치료를 목적으로 하는 의료 인공지능(AI)이 속속 임상 현장에 보급되고 있지만 대부분이 근거가 미약하다는 점에서 개선이 필요하다는 지적이 나왔다.

매우 제한된 데이터 세트로만 검증을 마친 채 곧바로 환자에게 사용되고 있다는 점에서 품질을 보장할 수 있는 지침이 필요하다는 것이 전문가들의 의견이다.

의료 인공지능의 검증 연구가 부실하다는 점에서 이에 대한 개선이 필요하다는 지적이 나왔다.

현지시각으로 19일 npj 디지털 의학(npj Digital Medicine)에는 인공지능 의료기기에 대한 체계적 검토 연구 결과가 공개됐다(10.1038/s41746-025-01726-8).

현재 인공지능 의료기기는 의료 분야에서 가장 빠르게 성장하고 있는 분야로 진단 보조부터 치료, 예측에 이르기까지 다양한 부분에서 개발이 이뤄지고 있다.

하지만 산업 육성을 위해 일정 부분의 안전성과 유효성이 보장되면 시장에 먼저 내보내는 이른바 선진입 제도가 활성화되면서 다양한 문제가 나오고 있는 것도 사실이다.

규제기관의 승인 당시에는 유효성이 입증됐지만 실제 환자에게 적용했을때 아무런 효과가 없거나 오류가 생기는 일이 지속적으로 보고되고 있기 때문이다.

유니버시티 칼리지 런던 아리엘 옹(Ariel Ong) 교수가 이끄는 연구진이 안과 영역을 중심으로 이에 대한 체계적 근거를 검토한 이유도 여기에 있다.

실제 인공지능 의료기기들이 어떠한 근거에서 승인을 받았고 또한 검증은 제대로 이뤄졌는지를 파악하기 위해서다.

이에 따라 연구진은 미국과 유럽, 호주에서 미국 식품의약국(FDA) 등이 승인한 안과 영역 인공지능 의료기기 36개를 분석했다.

그 결과 검토 대상 기기인 36개 중 19%는 승인의 기반이 된 연구가 동료 심사(Peer review)도 없이 진행된 것으로 나타났다. 말 그대로 정확도와 유효성에 대해 학자들의 검증이 없었다는 의미다.

또한 규제기관 승인의 기반이 된 연구 중 환자의 연령을 보고한 연구는 52%에 불과했으며 성별은 51%, 인종의 경우 21%에 불과했다. 범용성의 기반이 매우 허술하다는 뜻이다.

아리엘 옹 교수는 "승인된 대부분의 기기가 매우 단순한 데이터 셋으로 검증을 받았으며 특히 절반 가량이 매우 기본적인 정보인 성별과 연령 등도 분류되지 않은 데이터를 활용했다"며 "인구학적 특성에 대한 검증이 되지 않았다는 의미"라고 지적했다.

검토 결과 연구의 근거 수준 또한 상당히 부실했다. 36개 의료기기의 검증 연구 131편 중 중재적 연구가 8%에 불과했기 때문이다. 중재적 연구란 실제 임상 환경에서 기기를 시험하는 것을 의미한다.

또한 이미 출시된 의료기기 혹은 인공지능과 성능을 비교한 직접 비교 연구도 8%에 불과했고 의사가 행하는 표준 치료와 비교한 연구도 22%에 그쳤다.

아리엘 옹 교수는 "승인의 기반이 된 131건의 연구 중 중재적 연구가 불과 8% 밖에 되지 않는다는 것은 매우 놀라운 일"이라며 "동일선상에 있는 약물 등의 규제 및 심사, 근거에 비하면 말도 안되는 수준"이라고 꼬집었다.

이로 인해 이러한 인공지능 의료기기들에 대한 허가와 승인도 제각각으로 이뤄지고 있었다. 요구하는 근거 수준에 따라 허들을 넘는 국가와 그렇지 않은 국가가 극단적으로 나뉘고 있었던 것.

실제로 36개의 인공지능 의료기기 중 유럽에서는 97%가 사용 승인을 받았지만 이 기술 중 호주에서 허가를 받은 것은 22%에 불과했다. 특히 미국의 경우 이 중에서 불과 8%만이 최종 승인을 받았다.

아리엘 옹 교수는 "현재 환자 치료에 사용되는 약물 중 대다수가 미국과 유럽, 호주에서 허가를 받는 것과 비교하면 이러한 불균형은 말도 되지 않는 수준"이라며 "체계적이고 표준화된 검증 방법을 세워야 한다는 것을 시사한다"고 제언했다.

이어 그는 "특히 실제 임상 환경에서 어떻게 구동되는지를 검증한 근거가 매우 부족하다는 것은 심각한 문제"라며 "의료 인공지능 또한 약물과 마찬가지로 높은 근거 기준을 충족해야 한다는 점에서 고품질 중재 연구에 대한 지침이 시급하다"고 밝혔다.

댓글
새로고침
  • 최신순
  • 추천순
댓글운영규칙
댓글운영규칙
댓글은 로그인 후 댓글을 남기실 수 있으며 전체 아이디가 노출되지 않습니다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글
더보기
이메일 무단수집 거부
메디칼타임즈 홈페이지에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 방법을 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반할 시에는 정보통신망법에 의해 형사 처벌될 수 있습니다.