인하대병원 김정수 교수, 국내 첫 다기관 연구 성과 도출
뷰노메드 딥카스 유효성 입증…"RWD가 결국 가치 기반"
"의료 인공지능, 나아가 디지털헬스케어가 신뢰성을 가지기 위해서는 전향적 연구가 필수적입니다. 그러한 면에서 이번 연구가 그 물꼬를 텄다는데 의의를 두고 싶습니다."
전 세계적으로 의료 인공지능(AI)에 대한 전향적 연구의 필요성이 제기되고 있는 가운데 국내에서 처음으로 이에 대한 연구가 국제학술지를 통해 발표되면서 학계의 이목을 끌고 있다.
지금까지 의료 인공지능 의료기기에 대한 연구가 대부분 이전 시점의 의료 데이터를 활용한 후향적 연구에 매몰돼 있었다는 것을 감안하면 진일보된 성과라는 것이 학계와 산업계의 공통된 평가.
특히 이번 연구가 국내 최초 리얼월드데이터(RWD)에 기반한 전향적 연구로 설계돼 임팩트팩터(IF)가 19.344에 달하는 중환자의학 분야 최고 권위 학술지 크리니컬 케어(Critical Care)에 실렸다는 점에서 의의를 더한다.
아직까지 전 세계적으로도 의료 인공지능에 대한 전향적 연구가 극히 드물다는 점에서 국내 기술의 우수성과 이에 대한 검증 능력을 세계에 알리는 계기가 됐기 때문이다.
이번 연구를 주도한 인하대병원 호흡기내과 김정수 교수는 성과의 의의를 묻는 질문에 '신뢰'를 먼저 강조했다.
김 교수는 "지금까지 의료 인공지능과 관련한 연구들은 과거의 잘 정돈된 데이터에 기반한 후향적 연구로 진행된 것이 사실"이라며 "정확도 등을 입증할 수는 있지만 실제 임상현장에서의 다양한 변수를 반영한 유효성과 안전성, 나아가 범용성에 대한 신뢰를 보여주는데 한계가 있었다"고 설명했다.
그는 이어 "이번 연구가 의미를 가지는 것이 바로 이 부분"이라며 "실제 임상현장에서 충분히 의료 인공지능이 그 역할을 다할 수 있으며 전향적으로 범용성을 보여줬다는데 의의가 있다"고 덧붙였다. 즉 전향적 임상에서 뜻있는 성과가 나왔다는 설명이다.
실제로 이번 연구는 뷰노의 인공지능 기반 심정지 예측 의료기기인 뷰노메드 딥카스를 기반으로 서울대병원과 분당서울대병원, 인하대병원, 동아대병원 등 국내 상급종합병원 4곳에서 다기관 전향적 연구로 진행됐다.
3개월간 일반 병동에 입원한 총 5만 5083명의 환자를 대상으로 기존에 활용하던 표준 도구인 NEWS(National Early Warning Score)과 비교해 딥카스가 심정지와 중환자실 전실, 오경보율에서 우위를 점하는지를 평가한 것.
그 결과 딥카스는 정확도에 대한 성능지표인 곡선하 면적(AUROC)이 0.869로 NEWS의 0.767을 가볍게 따돌렸으며 같은 민감도 대비 1000병상 당 알람 횟수도 절반 이상 감소시키는 유효성을 입증했다.
김정수 교수는 "지금까지 의료 인공지능 분야에서 전향적 연구가 드물었던 것은 설계와 변인 통제 자체가 어려웠기 때문"이라며 "특히 병원마다 워크플로우가 일정 부분 상이하다는 점에서 궁극적 목적인 연구 종점(End point)를 잡는데 상당한 어려움이 있는 것이 사실"이라고 전했다.
그는 이어 "그러한 면에서 국내 4개 상급종합병원에서 진행된 다기관 전향적 연구에서 이같은 성과를 냈다는 것은 딥카스가 가지는 범용성을 보여준다"며 "어느 병원에 이를 도입해도 같은 효과를 낼 수 있다는 것을 보여준 중요한 성과"라고 강조했다.
특히 그는 이번 연구에서 딥카스가 오경보율을 크게 줄이는 효과를 증명한 것이 향후 중환자 관리 등에 상당한 영향을 줄 것으로 전망했다.
이미 유효성과 안전성 등은 후향적 연구 등에서도 충분히 입증됐지만 경보시스템의 가장 큰 난제를 풀어냈다는 점에서 활용도를 입증했다는 평가다.
김 교수는 "더욱 의미가 있는 것은 바로 오경보율을 NEWS 등에 비해 크게 줄인 것을 인정받았다는 점"이라며 "의료 인공지능의 특성상 많은 스크리닝을 진행해 더 많이 찾아내는 것보다 중요한 것이 바로 필요한 정보를 정확하게 찾아내는 것이기 때문"이라고 말했다.
이어 그는 "그런면에서 알람을 크게 줄이면서도(오경보율 절반 이상 감소) 더 정확하게(AUROC 0.869) 위험한 환자를 골라낼 수 있다는 것은 의료진의 피로도를 크게 줄일 수 있는 워크플로우의 효율화에 기반이 된다"며 "딥카스의 존재 이유를 보여준 것"이라고 덧붙였다.
그러한 면에서 그는 이번 전향적 연구가 딥카스의 확산에도 큰 기여를 할 것으로 기대했다. 연구 결과 자체가 곧 딥카스의 설득력이 된다는 설명이다.
김정수 교수는 "지금까지 수많은 의료 인공지능이 임상에서 외면받은 이유는 바로 가치를 인정받지 못했기 때문"이라며 "의료진은 업무 특성상 의심이 많은 사람들이라는 점에서 확고한 데이터가 없이는 절대 움직이지 않는다"고 지적했다.
그는 이어 "딥카스가 여러 병원으로 확산되고 있는 가장 큰 배경은 바로 이미 4편의 연구를 통해 객관적으로 데이터를 입증했기 때문"이라며 "여기에 임팩트팩터가 20점대인 크리티컬 케어에 전향적 연구를 실으며 신뢰도를 더했다는 점에서 확산의 계기가 될 것"이라고 내다봤다.
그러한 면에서 그는 향후 의료 인공지능이 나아가야 할 방향도 여기에 있다고 강조했다.
아무리 좋은 기술이라도 의료진이 필요성을 느끼지 않으면 의미가 없는 만큼 적극적으로 의료진과 소통하며 전향적 연구를 통해 말 그대로 '쓸모'를 입증해야 한다는 것이다.
김 교수는 "대다수 의료 인공지능이 시장에서 외면받고 있는 가장 큰 이유는 기술력은 뛰어나지만 의료진이 믿을 만한 객관적 데이터가 없고 쓸모를 입증하지 못하고 있기 때문"이라며 "국내외 의료기기 박람회를 돌아다녀봐도 정확하다고 자랑하는 인공지능은 수도 없이 많지만 도대체 어디다 쓰라는 물건인지 모르는 경우가 태반"이라고 꼬집었다.
이어 그는 "결국 전향적 연구를 통해 객관적 실증 자료를 갖추고 의료진에게, 또한 환자에게 어떤 도움을 줄 수 있는지 정확하고 구체적인 목표를 제시하는 것이 핵심"이라며 "현실과 동떨어진 기술을 만들어 놓고 정확하다고 자화자찬하는 인공지능은 절대 살아남을 수 없다"고 밝혔다.