개인정보 보호를 위한 비밀번호 변경안내 주기적인 비밀번호 변경으로 개인정보를 지켜주세요.
안전한 개인정보 보호를 위해 3개월마다 비밀번호를 변경해주세요.
※ 비밀번호는 마이페이지에서도 변경 가능합니다.
30일간 보이지 않기
  • 전체
  • 일반뉴스
  • 오피니언
  • 메타TV

전문의 수준 왔다던 챗 지피티…실제 임상 진단은 엉망

메디칼타임즈=이인복 기자거대언어모델인 챗 지피티(Chat-GPT)가 전문의 수준까지 발전했다는 보고가 이어지고 있지만 실제 임상 적용은 위험할 수 있다는 연구 결과가 나와 주목된다.검증된 진단 도구와 유사한 수준으로 진단을 내릴 수는 있지만 같은 데이터에 같은 값을 내는 동일성 부분에서 낙제점을 받았기 때문이다.챗 지피티가 일정 부분 정확도를 보장하지만 동일성 부분에서 한계가 있다는 지적이 나왔다.현지시각으로 2일 국제 학술지 플로스 원(PLoS ONE)에는 챗 지피티를 활용한 임상 진단의 정확도 및 신뢰도에 대한 대규모 연구 결과가 게재됐다(10.1371/journal.pone.0301854).현재 챗 지피티는 고도화가 지속적으로 진행되면서 점차적으로 버전이 업그레이드 되고 있는 상황이다.이미 미국 의사 시험을 우수한 성적으로 통과한데 이어 특정 질환의 경우 전문의를 앞지르는 정확도를 보여주며 실제 임상 적용의 가능성을 높여가고 있는 상태.이로 인해 의학계에서는 다양한 방법으로 이를 검증해가며 임상 현장에 이를 도입하기 위한 노력을 지속하고 있다.워싱턴의과대학 로렌스 루이스(Lawrence Lewis) 교수가 이끄는 다기관 연구진이 이에 대한 검증 연구에 들어간 배경도 여기에 있다.비 외상성 흉통으로 응급실을 찾는 환자가 지속적으로 늘고 있지만 이에 대응할 수 있는 의료진은 적다는 점에서 주요 진단 도구를 학습시키고 이를 기반으로 챗 지피티를 예측 모델로 만든다면 임상에 도움이 될 수 있다는 판단에서다.이에 따라 연구진은 무작위로 시뮬레이션된 1만개의 환자 데이터를 기반으로 3개의 데이터 세트를 구성했다.하나는 비 외상성 흉통이 있는 환자에게 30일~6주간 주요 심혈관계 질환 위험(MACE)을 측정하는 도구인 TIMI로 검증했고 또 하나는 3개월에 걸쳐 MACE를 예측하는 응급실 심혈관 질환 예측 도구인 HEART 척도가 포함됐다.또한 나머지 하나는 44개의 무작위 건강 변수를 대입해 이 세가지 데이터 세트를 챗 지피티를 통해 진단을 내리도록 주문했다.그 결과 일단 챗 지피티는 매우 높은 정확도로 이러한 표준 평가 척도와 유사한 답변을 내놓는데 성공했다.TIMI 데이터의 경우 89%, HEART 점수는 92%로 높은 상관관계를 보였기 때문이다. 전문의가 TIMI를 통해 예측한 위험도와 챗 지피티가 예측한 위험도가 매우 유사했다는 의미다.하지만 문제는 동일성이었다. 즉 한명의 환자 데이터를 줬을때 지속적으로 같은 결과값을 내는가에 대한 부분이다.실제로 TIMI와 HEART 점수를 기반으로 한 전문의들의 판단은 동일성이 유지됐지만 챗 지피티의 경우 44%가 다른 결과값을 내놨다.동일한 환자 데이터를 가지고 처음에는 급성 심근경색이 위험하다는 진단을 내렸다가 다음에는 아무 이상이 없다는 결과를 내놓은 셈이다.연구진은 바로 이 부분에서 챗 지피티의 임상 적용은 아직 시기상조라고 결론내렸다. 불확실성에 대한 부분이 해결되지 않으면 더 위험한 상황이 벌어질 수 있다는 것이다.로렌스 루이스 교수는 "TIMI나 HEART와 같은 척도들과 매우 유사한 수준의 상관관계를 갖는다는 것은 분명히 희망적인 부분"이라며 "하지만 동일성 부분에서 챗 지피티는 사실상 낙제점을 받았다"고 지적했다.그는 이어 "똑같은 환자의 동일한 데이터를 두고 챗 지피티는 위험하다고 했다가 위험하지 않다고 판단하는 등 무작위성을 보였다"며 "임상 현장에서 단일하고 일관된 진단은 매우 중요한 부분인 만큼 이러한 무작위성은 인정될 수 없는 지표"라고 밝혔다.
2024-05-03 05:30:00의료기기·AI

똑똑해지는 챗 지피티…한국어 퇴원 요약도 가능할까

메디칼타임즈=이인복 기자거대언어모델인 챗 지피티(Chat-GPT)는 영어가 아닌 한국어로도 환자에게 제공하는 퇴원 요약서를 제대로 작성할 수 있을까.결과적으로 '그렇다'는 결론이 나왔다. 많은 데이터를 학습시키지 않고도 실제 임상 현장에서 쓸 수 있을 정도의 문서를 만들어냈기 때문이다.챗 지피티가 한국어로된 퇴원 요약서도 능숙하게 작성할수 있다는 연구가 나왔다오는 29일 대한의학회 국제학술지 Journal of korean medical science에는 챗 지피티를 활용한 퇴원 요약서 프로그램에 대한 검증 연구 결과가 게재될 예정이다.현재 챗 지피티를 임상 현장에 활용하기 위한 연구는 전 세계적으로 이뤄지고 있는 상태다.특히 세계적으로 의사의 번아웃이 심각한 문제로 떠오르면서 업무량을 줄이기 위한 대안으로 급부상하고 있는 상황.미국과 유럽 등에서 의사의 가장 큰 로딩 중 하나인 의무기록과 퇴원 요약서 작성에 챗 지피티를 활용을 적극적으로 도입하고 있는 이유다.실제로 지난달 국제학술지 액타 올쏘피디카(Acta Orthopaedica)에는 챗 지피티를 통한 퇴원요약서 작성의 유효성에 대한 연구 결과가 게재된 바 있다(10.2340/17453674.2024.40182).전문의와 전공의 10명이 작성한 퇴원 요약서와 챗 지피티가 작성한 요약서를 무작위로 섞은 뒤 15명의 전문의가 정확도를 평가한 것.결과는 놀라웠다. 15명의 전문가 평가에서 전문의가 작성한 퇴원 요약서와 챗 지피티가 작성한 요약서는 점수에 차이가 없었다. 전문가가 봐도 어느 것이 챗 지피티가 작성한 것인지 몰라볼 정도라는 의미다.그러나 퇴원 요약서 작성에 걸리는 시간은 큰 차이를 보였다. 챗 지피티가 전문의들의 평균 작성 시간에 비해 10배나 빨리 문서를 작성했기 때문이다.그렇다면 영어에 비해 아직까지 완성도가 크게 떨어진다는 평가를 받는 한국어 챗 지피티 버전은 어떨까.연세대 의과대학 유승찬 교수가 이끄는 연구진은 이를 검증하기 위해 심근경색 환자 50명과 일반 외과 환자 50명의 퇴원 요약서 100개를 사용해 챗 지피티가 한국어 퇴원 요약서 작성이 가능한지를 검증했다.또한 각 문서에 대해 세가지 프롬프트(Zero-shot, One-shot, Few-shot)을 사용해 각 요약서를 비교 분석했다. 평가 척도는 5점 만점의 리커트(Likert) 척도였다.러닝머신의 학습법을 뜻하는 샷(shot)은 학습 데이터의 양을 뜻한다. 제로샷은 아예 라벨링이 없는 데이터로 학습한 것을 의미하며 원샷은 1개 데이터로 학습시킨 것을, 퓨샷은 2~5개 데이터로 학습한 것을 의미한다.평가 결과 제로샷 프로프트의 경우 평균 점수가 3.73±0.44를 기록했다. 또한 원샷의 경우 4.11±0.36로 집계됐다. 이어 퓨샷 프롬프트는 4.19±0.36로 나왔다. 당연하게도 퓨샷 프롬프트가 가장 높은 평가 점수를 받은 셈이다.전체 평가 중 가장 높은 평가를 받은 문서는 퓨샷에서 생성돼 4.9점으로 거의 만점을 받았다. 가장 낮은 평가는 제로샷에서 만들어진 것으로 2.7점을 기록했다. 신뢰할 수 없다는 의미가 된다.결과적으로 4점 이상, 즉 신뢰할만한 퇴원 요약서를 만들어낸 비율을 보면 퓨샷의 경우 77%, 원샷의 경우 70%, 제로샷은 32%로 분석됐다.신뢰할 수 없는 수준인 3점 이하는 퓨샷과 원샷 프롬프트에서 모두 0%를 기록했으며 제로샷만 2%로 조사됐다.연구진은 이러한 결과에 대해 챗 지피티가 한국어로도 충분히 활용 가능한 퇴원 요약서를 만들 수 있다는 것을 의미한다고 설명했다.퓨샷과 원샷 모두 5점 만점에 4점 이상의 평균 종합 점수를 얻은 것은 사실상 바로 임상에서 활용이 가능하다는 것이다.연구진은 "특히 심근경색 환자와 일반외과 환자 모두에서 점수에 차이가 없었다는 것은 충분히 범용으로 활용이 가능하다는 것을 의미한다"며 "당장에라도 임상 의사의 퇴원 요약서 작성 로딩을 덜어줄 수 있다는 것을 보여준다"고 전했다.이어 "특히 퓨샷 프롬프트의 경우 평균 용이성 점수가 4.39 ± 0.45로 이는 영어가 주를 이루는 의학 용어에 대한 지식이 없는 사람들도 아무 부담없이 이를 읽고 이해할 수 있다는 것을 의미한다"며 "의사들의 고민을 크게 줄여줄 수 있을 것"이라고 밝혔다.
2024-04-23 05:30:00의료기기·AI

임상 효용 높아지는 챗 지피티…퇴원 안내 작성 10배 빨라

메디칼타임즈=이인복 기자생성형 인공지능인 챗 지피티(Chat-GPT)가 학습을 거듭하면서 임상 적용의 가능성을 높이고 있다.단순히 의학 논문 작성이나 요약 등을 넘어 의사의 업무를 획기적으로 줄이는 수단으로 각광받고 있는 것. 배경은 속도와 정확성이다.챗 지피티가 전문의와 비교해 내용의 질이 떨어지지 않으면서도 10배 빠르게 기록을 작성한다는 연구가 나왔다.현지시각으로 27일 국제학술지 액타 올쏘피디카(Acta Orthopaedica)에는 챗 지피티의 임상적 효용성에 대한 연구 결과가 게재됐다(10.2340/17453674.2024.40182).현재 챗 지피티 등 거대언어모델은 초창기에 비해 학습이 지속되면서 보다 정확도가 높아지고 있다는 평가를 받고 있다.출시 초기 환각 등의 문제가 지적됐지만 방대한 학습이 지속적으로 이뤄지면서 점점 이를 보완해가고 있는 셈이다.의학계에서 이에 대한 활용법을 모색하고 있는 것도 이러한 이유 때문이다. 전 세계적으로 의사의 번아웃이 문제가 되고 있다는 점에서 이를 보완할 수 있는 도구로 주목하고 있는 것이다.웁살라 의과대학 사이러스 브로덴(Cyrus Brodén) 교수가 이끄는 연구진이 의사와 챗 지피티를 비교하는 흥미로운 연구를 진행한 배경도 여기에 있다.과연 챗 지피티가 논문 작성이나 요약 등을 넘어 실제로 임상 현장에서 활용이 가능한지를 확인하기 위해서다.이에 따라 연구진은 의료진의 가장 큰 로딩 중 하나인 의무기록과 퇴원 안내서 작성을 두고 챗 지피티의 성능을 시험했다.모든 의료기관에서 퇴원 환자에게 질환과 수술 및 치료 경과, 처방 약물에 대한 설명, 주의사항 등을 담은 안내서를 전달한다는 점에서 과연 챗 지피티가 이러한 문서를 작성할 수 있는지를 확인한 것이다.연구는 정형외과 전문의와 대학병원 전공의 10명이 퇴원 안내서를 작성하고 챗 지피티가 작성한 문서와 비교하는 방식으로 진행됐다.이에 대한 평가는 블라인드 형태로 15명의 전문가 패널이 진행했다. 어느 것이 의사가 작성한 것이고 어떤 것이 챗 지피티가 쓴 것인지 모르는 상태에서 정확도와 충실도를 평가한 셈이다.결과적으로 챗 지피티는 매우 충실하고 정확하게 환자의 퇴원 안내서를 적어내는데 성공했다. 전문의가 작성한 문서와 평가 점수에 차이가 없었기 때문이다.중요한 것은 속도였다. 전문의가 작성한 퇴원 안내서와 질적인 면에서 차이가 없음에도 전문의들의 평균 작성 시간보다 10배나 빠르게 문서를 작성했기 때문이다.연구진은 이러한 결과가 챗 지피티의 가능성을 설명한다고 강조했다.사이러스 브로덴 교수는 "챗 지피티는 전문의가 작성한 퇴원 안내서와 품질 면에서 거의 차이가 없는 상태로 무려 10배나 빠르게 기록을 작성했다"며 "향후 전문의 등 의료진의 로딩을 획기적으로 줄여줄 수 있는 잠재력이 있다는 의미"라고 밝혔다. 
2024-03-28 05:30:00의료기기·AI

치협 '2024 성공개원 방정식' 세미나 개최 "만원 세례"

메디칼타임즈=김승직 기자대한치과의사협회가 '2024 성공개원 방정식-어쩌다 개원' 세미나를 개최했다. 막막한 개원가 경영환경에 불안감을 해소하기 위한 강연들로 구성했다는 설명이다. 28일 의료계에 따르면 대한치과의사협회는 지난 24일일 오후 서울대치과병원 대강당에서 '2024 성공개원 방정식-어쩌다 개원'을 개최했다. 대한치과의사협회는 지난 24일일 오후 서울대치과병원 대강당에서 '2024 성공개원 방정식-어쩌다 개원'을 개최했다. 이 세미나는 지난해까지 코엑스에서 '컨퍼런스' 형태로 진행돼 오다 올해부터 새롭게 형식을 바꿔 개최됐다. 참가자 모집 한 달 만에 조기마감 될 정도로 관심을 끌었으며, 행사 당일 210석의 강연장을 가득 채웠다는 게 치협의 설명이다. 이날 첫 번째 순서으로 챗GPT연구회 정석환 위원의 'Chat-GPT로 혁신하는 병원 경영'이 특별 강연이 이뤄졌다. Chat-GPT를 이용한 혁신적인 병원 운영 방법을 소개하고 병원 업무에 접목시켜 미래 지향적인 경영 전략을 세워볼 수 있는 방안을 제시했다는 설명이다. 두 번째 연자인 엔와이치과의원 강익제 원장은 'Manners makes the DAEBAK'를 주제로 한 직원친절교육 강연을 진행했다. 그는 경쟁력 확보를 위해 미묘한 차이가 큰 차이를 만들어 낸다며 무엇이 고객입장에서 친절한 것인지 교육을 받아야 한다고 강조했다. 또 원장부터 친절하게 바뀌어야 직원들도 바뀐다고 당부했다. 마지막으로, 강일예스치과의원 이윤형 원장은 '폐업의 문턱에서 디지털로 기사회생한 SSUL'을 주제로 본인의 12년 간의 개원 경험을 담은 이야기를 전했다. Digital Dentistry가 어떤 변화를 이끌어 왔고 차별화에 성공한 자신의 개원실패 극복기를 리얼하게 소개했다는 평가다. 치협 황혜경 부회장은 박태근 협회장을 대신한 인사에서 "경영환경이 갈수록 어려워지는 개원가에서 어떻게 병원을 운영할지 막막하기만 한 불안감을 조금이나마 떨쳐 드리기 위한 내용으로 강연을 준비했다"며 "어려움 속에서 고군분투 하고 있을 젊은 치과의사 분들에게 실질적인 도움과 지식을 제공해드릴 수 있어 의미 있는 시간 이었다"고 밝혔다. 치협 이한주 경영정책이사는 "회원들의 경영 환경을 개선하기 위해 치과 개원가의 요구 및 현실을 반영해서 이번 세미나를 고심 끝에 기획했다"며 "이렇게 많은 관심과 호응을 해주셔서 감사드린다. 하반기에도 이 열기를 이어 더욱 알찬 세미나를 준비해서 찾아뵙겠다. 많은 기대와 관심 부탁드린다"고 말했다.
2024-02-28 13:18:54병·의원

렉라자부터 첫 국산 DTx까지…산업계 달군 키워드는?

메디칼타임즈=이인복 기자국산 폐암 신약 렉라자의 초고속 1차 치료제 급여부터 히알루론산 점안제 퇴출 논란까지 유난히 굵직한 이슈가 많았던 2023년. 메디칼타임즈가  제약 분야와 의료기기, 학회, 학술 분야에서 올해 주목할만한 뉴스들을 모아 10대 뉴스를 정리했다. 초고속으로 급여 진입한 렉라자 타그리소와 경쟁 본격화국산 폐암 신약인 렉라자가 초고속으로 규제 허들을 넘어서며 타그리소와 나란한 출발선에 섰다.렉라자가 초고속 허가와 급여 진입에 성공하면서 타그리소와 정면 대결을 펼치게 됐다.마침내 올해 1차 치료제로 급여권 진입이 확정되며 허가 3년만에 타그리소를 따라잡은 것. 허가부터 급여 등재까지 지금까지 유례가 없을 정도의 속도다. 초고속 신화라고 불리는 이유다.렉라자는 지난 비소세포폐암을 적응증으로 2021년 1월 국내 31호 신약으로 허가를 받은 뒤 곧바로 급여 신청에 들어가 6개월만인 7월 2차 치료제로 급여가 등재되며 신화의 시작을 알렸다.이후 지난 6월 식품의약품안전처로부터 1차 치료제로 사용 승인을 받았으며 이후 다시 6개월만인 이달 11일 건강보험정책심의위원회에서 1차 치료까지 급여 범위를 확대하는데 성공했다.경쟁 약물인 타그리소가 2018년 1차 치료제 승인을 받은 뒤 마찬가지로 급여에 등재되기 까지 5년이 소요된 것과 비교하면 믿기 힘들 정도의 속도다.이에 따라 두 약물은 내년 1월 나란히 상피세포 성장인자 수용체(Epidermal Growth Factor Receptor, EGFR) 돌연변이 양성 비소세포폐암(Non-small Cell Lung Cancer, NSCLC) 1차 치료제로 본격적인 경쟁에 나서게 된다.현재 복지부는 연간 타그리소 처방 환자가 1352명, 렉라자 처방 환자가 1282명이 될 것으로 추계하고 있다. 두 약물이 비등한 규모로 시장을 양분할 것이라는 전망이다.하지만 실제 임상 현장의 목소리는 차이가 있다. 1차 치료제의 특성상 초반에 어느 약물이 우위를 점하는가가 향후 시장 점유율에도 영향을 줄 수 있다는 분석이 우세하다.이에 맞춰 두 제약사도 내년 1월 1차 치료제 급여 적용에 맞춰 대대적인 마케팅과 프로모션을 계획하고 있다는 점에서 내년 초 두 약물의 피튀기는 경쟁이 본격화될 것으로 전망된다.약물 급여 적정성 재평가 파장…기로에 선 히알루론산정부가 건강보험 재정 건전성 확보를 목적으로 급여 적정성 재평가 항목을 점차적으로 늘려나가면서 히알루론산 점안제가 퇴출 기로에 섰다.올해도 약물에 대한 급여 적정성 재평가가 지속되면서 히알루론산 점안제 퇴출을 놓고 논란이 이어지고 있다.실제로 그동안 콜린알포세레이트 등 급여 재평가 항목에 올랐던 약물은 대부분 급여권에서 퇴출되는 수순을 밟았다는 점에서 히알루론산 점안제 또한 퇴출되는 것이 아니냐는 전망이 우세했던 상황.하지만 대한안과의사회 등이 건선안 환자의 부담 등을 지적하며 반대의 목소리를 내기 시작하면서 상황이 다소 변화하기 시작했다.국회에서도 김영주 국회부의장이 직접 간담회를 주관하며 환자 부담을 고려해 급여 유지가 필요하다는 의견을 내면서 여론전 양상이 벌어졌기 때문이다.이로 인해 히알루론산 점안제의 재평가 결과는 수차례 걸친 논의에도 여전히 도마 위에서 결론이 나지 못하고 있는 상황이다.쇼그렌증후군, 피부점막안증후군과 같은 내인성 질환은 급여를 유지하되 수술이나 콘텍트렌즈 착용 등에 의한 외인성 질환은 급여를 축소하는 방안으로 가닥은 잡혔지만 확정이 되지 않고 있는 셈이다.이로 인해 보건복지부는 지난 20일 건강보험정책심의위원회에서 다시 한번 '약제 급여 목록 및 급여 상한 금액표 개정안'을 통해 히알루론산 점안제를 안건으로 올렸지만 또 다시 평가가 미뤄졌다.함께 재평가 대상에 올라갔던 리마프로스트알파덱스, 룩소프로펜 나트륨, 에피나스틴염산염 등 3개 성분에 대한 급여 범위가 축소된 것과는 대조적인 모습이다.이에 대해 복지부는 일회용 점안제 전반에 대한 급여 기준 설정이 필요하다는 의견을 검토한 뒤 히알루론산 점안제의 재평가 결과를 확정하겠다는 입장이라 이 논란은 2024년에도 지속될 것으로 보인다.엔허투가 쏘아 올린 공…ADC 전성시대 열리나유방암 표적 항암제인 엔허투가 전 세계적으로 돌풍을 일으키며 1조원이 넘는 매출을 올리면서 항체약물접합체(ADC) 시장이 가열되고 있다.엔허투가 글로벌 매출 1조원을 넘어서는 대박을 터트리면서 ADC 약물에 대한 관심이 높아지고 있다.항체의 장점인 암세포에 대한 선택성과 화학 약물의 강점인 암세포 사멸 기능을 결합해 기존 약물보다 치료 효과를 높이면서도 부작용을 줄이면서 가능성을 인정받고 있는 것.실제로 지난 6월 미국임상종양학회(ASCO)에서 발표된 중간 분석 결과 엔허투는 객관적 반응률(ORR)이 37.1%를 기록했으며 HER2가 과발현된 환자군에서는 61.3%에 달하는 ORR을 보였다.또한 경쟁 약물로 꼽히는 케싸일라과 비교해 무진행 생존 기간을 22개월이나 늘렸으며 마찬가지로 같은 약물 대비 사망 위험을 36%나 감소시켰다.이를 기반으로 엔허투는 지난 2022년에만 매출 13억 1000만 달러(한화 약 1조 6천억원)의 매출을 올리며 명실공히 글로벌 블록버스터로 자리를 굳히고 있다.이처럼 엔허투가 성공 신화를 쓰면서 ADC 시장도 덩달아 주목받고 있다. 가능성으로만 제기됐던 ADC가 성과로 이어진 현실에 시장이 움직이고 있는 셈이다.이에 맞춰 국내 기업들도 발빠르게 ADC 시장을 선점하기 위해 움직이고 있다.셀트리온이 영국 익수다 등과 협력 관계를 맺고 개발을 진행중이며 레고켐바이오와 알테오젠 등도 현재 개발에 열을 올리고 있는 상황이다.이에 따라 과연 엔허투를 이을 ADC 약물이 내년에도 빛을 볼 수 있을지 또한 국내사들의 노력이 성과로 이어질지에 관심이 모아지고 있다.국내 첫 디지털치료기기 탄생…실제 처방 초읽기올해 처음으로 국산 디지털치료기기(DTx)가 세상에 나오면서 과연 어떠한 성과를 이뤄낼지 이목이 집중되고 있다.국내에서 에임메드와 웰트의 디지털치료기기가 나란히 허가를 받으면서 실제 처방이 가시화되고 있다.주인공은 바로 에임메드의 솜즈(Somzz)와 웰트의 웰트 아이(WELT-I)로 두 기기 모두 불면증을 적응증으로 하고 있다.스타트는 솜즈가 끊었다. 지난 2월 국내 첫 디지털치료기기로 허가를 받으면서 국내 시장의 문을 연 것. 이어서 웰트 아이가 4월 곧바로 바통을 이어받으면서 마침내 국산 디지털치료기기 시대가 열렸다.기대하던 수가 문제도 일단은 물꼬를 텄다. 혁신의료기기 통합 심사를 통해 건강보험 임시등재 방식으로 일단 급여권에 들어섰기 때문이다.26일부터 시행되는 디지털치료기기 건강보험 임시 등재 운영지침에 따르면 담당 의사가 외래에서 치료 목적으로 디지털치료기기를 처방하는 경우 환자가 본인부담 90%를 지급하는 조건으로 이를 활용할 수 있게 된다.병원들도 처방을 위한 준비에 들어간 상황이다. 이미 서울대병원과 세브란스병원, 삼성서울병원 등은 연구윤리심의위원회(IRB)와 자체 보험 심사를 통해 처방을 위한 준비를 마친 상황.이르면 내년부터 본격적으로 국내에서 디지털치료기기를 활용한 불면증 치료가 시작된다는 의미다.하지만 아직 넘어야할 산도 많다. 일단 지난 9월 선진입 후평가 제도를 통해 일단 제도권 내에 들어오기는 했지만 결국 신의료기술평가라는 커다란 허들이 남아있다. 또한 건강보험 또한 임시 등재에 불과하다는 점에서 이에 대한 근거 마련도 숙제 중 하나다.이에 따라 과연 세상에 나온 국산 디지털치료기기가 이러한 허들을 무사히 뛰어 넘고 세계 시장으로 나아갈 수 있을지 관심이 모아지고 있다.의학계 강타한 챗 지피티…의학회도 활용 방안 모색거대 언어 모델(LLM), 혹은 생성형 인공지능(AI)으로 불리는 챗 지피티(Chat-GPT)의 등장으로 의학회들의 움직임도 바빠지고 있다.챗 지피티를 활용한 연구가 주목받으면서 각 학회들도 이에 대한 활용법 모색에 나섰다.학생 교육부터 논문 작성을 넘어 스마트 병원 모델 등에 활용도가 부각되면서 실제적인 효용성에 대한 검증 작업에 들어간 것이다.실제로 대한심장학회, 대한영상의학, 대한신경과학회 등 전문과목 학회부터 대한의료정보학회 등까지 올해 학술대회에서는 빠짐없이 챗 지피티에 대한 논의가 진행됐다.임상에 적용할 수 있는지와 연구에 활용이 가능한지, 나아가 학생들의 교육에도 활용할 수 있는지 등 다양한 측면에서 활용성을 점검하는 자리가 마련된 것.하지만 논란은 여전하다. 일단 논란을 관통하는 키워드는 바로 저작권이다. 연구 분야에서 가장 민감한 부분이라는 점에서 이 부분을 두고 의견차가 좁혀지지 않고 있는 셈이다.긍정론의 입장에서는 참고 자료로서 혹은 결과를 요약하고 오류를 점검하는 과정에서 챗 지피티의 유용성을 강조하고 있다. 하지만 반대 입장에서는 이러한 불완전성을 안고 연구나 교육에 활용할 수는 없다고 지적한다.이렇듯 논란이 이어지자 지난 6월 국제의학저널편집자위원회(ICMJE)는 챗 지피티에 대한 활용 규정을 신설하고 기술을 사용했는지 여부를 의무적으로 명시하도록 규정했다.또한 대한영상의학회도 논문 작성에 있어 챗 지피티의 올바른 활용법에 대한 가이드라인을 마련하고 학술지를 통해 이를 공개했다.아울러 다른 국내 학회들도 내부적으로 위원회 등을 구성하며 학술적, 교육적 활용 기준을 만들기 위한 작업에 착수한 상태다.이에 따라 과연 챗 지피티 활용에 대한 의학계의 중지가 모아질 수 있을지 또한 어느 학회가 선제적으로 이에 대한 가이드라인을 제시할 지를 두고 학계의 관심이 모아지고 있다.
2023-12-27 05:30:00제약·바이오

전문의 수준이라는 챗GPT…시험 출제도 가능할까?

메디칼타임즈=이인복 기자거대 언어 모델(LLM)의 대표 주자인 챗 지피티(Chat-GPT)가 전문의 수준에 이르렀다는 보고가 이어지고 있지만 한계는 여전하다는 연구 결과가 나왔다.필요한 논문을 제시하고 학생 수준의 객관식 시험을 출제한 뒤 모범 답안을 제시하는 일을 시키자 탈락 수준의 결과를 내놨기 때문이다.챗 지피티가 전문의 수준에 이르렀다는 보고가 이어지고 있지만 여전히 한계가 있다는 연구가 나왔다.현지시각으로 21일 학술 병리학(Academic Pathology)지에는 챗 지피티를 활용해 시험 문제를 생성하는 최초의 연구 결과가 게재됐다(10.1016/j.acpath.2023.100099).거대 언어 모델, 이른바 생성형 인공지능을 불리는 챗 지피티는 의학 분야에서도 활용성을 두고 활발한 연구가 이뤄지고 있는 도구 중 하나다.모델이 고도화되면서 사실상 전문의 수준까지 이르렀다는 보고가 나오면서 기대감을 높이고 있는 상황.실제로 미국 앤서블헬스(Ansible Health)의 연구 결과 챗 지피티는 이미 미국 의사 시험(USMLE)를 무난하게 통과한 바 있다.스텝 1,과 스텝2, 스텝 3 등 3단계에 걸친 의사 시험 문제에서 추출한 305개 문항을 단 5초만에 풀어내며 합격점을 받은 것.특히 미국 유타의과대학에서 이뤄진 연구에서는 전문의 수준의 심층적인 임상 분석 질문 13개를 의학적 오류 없이 풀어내 주목받은 바 있다.챗 지피티가 풀어낸 답변을 세계적 권위의 미국암연구소에 의뢰하자 전문가 모두가 100%의 동의로 의학적 근거가 충분하며 정확한 답변이라고 평가한 것이다.미국 보스턴 의과대학 알렉산더(Alexander Ngo) 교수가 이끄는 연구진이 챗 지피티에게 학생들을 위한 시험 문제 출제 과제를 준 배경도 여기에 있다.이미 전문의 수준까지 이르렀다면 학생들에게 필요한 문제를 내고 모범 답안을 작성하는 일도 가능할 것이라는 가정에서다.이에 따라 연구진은 보스턴 의과대학에서 진행되는 면역학 수업에 대한 자료를 모두 챗 지피티에게 주고 학생들을 위한 모의 문항을 만들라고 주문했다.객관식 문항을 만들고 정답에 대한 설명을 붙여 학생들을 위한 교육 자료를 만들라고 지시한 셈이다.하지만 결과는 참담했다. 필요한 학습 자료와 논문을 모두 챗 지피티에게 주었음에도 60개의 질문 중 19개만 제대로 만들어냈기 때문이다.알렉산더 교수는 "매우 안타깝게도 챗 지피티는 그 많은 자료를 가지고도 불과 32%만 제대로 된 근거를 갖춘 질문과 답변을 만들었다"며 "지금까지 챗 지피티의 성능을 참조해 충분히 가능하다고 판단된 주문을 했지만 결과는 기대에서 한참 떨어졌다"고 설명했다.또한 챗 지피티는 질문에 대한 올바른 답변을 내는데도 실패했다. 절반이 넘는 질문에 대해 잘못된 답변을 제시했기 때문이다.거짓말도 여전했다. 실제로 60개의 질문 중 25%는 의학적 근거가 없거나 낭설에 불과한 정보를 끌어왔다.알렉산더 교수는 "현재 챗 지피티를 활용해 리포트나 나아가 논문 작성까지 활용하고 있다는 점을 감안하면 매우 실망스러운 결과"라며 "그럼에도 챗 지피티를 학생 교육에도 활용할 수 있는지 여부에 대해 동료 평가(피어 리뷰)를 거친 최초의 연구라는 점에서 의미는 있다"고 설명했다.이어 그는 "32%의 결과는 사실상 학생 수준에서도 낙제점에 해당한다"며 "하지만 여전히 많은 연구자들은 학생 교육에 있어 챗 지피티가 유용하다는 생각에 변함이 없는 만큼 관련 연구는 이어질 것으로 보인다"고 내다봤다.
2023-12-22 05:30:00의료기기·AI

챗 지피티 위험성 경고 나선 의학자들 "허위 정보 대량 생산"

메디칼타임즈=이인복 기자챗 지피티(Chat-GPT) 등 인공지능 기반 거대언어모델(LLM)이 잘못된 의학 정보를 대량 생산할 수 있어 규제 방안이 시급하다는 경고가 나왔다.단기간에 잘못된 정보를 포함한 게시 글이나 사진, 영상까지 광범위하게 생성해 확산시킬 수 있다는 점에서 보건의료체계에 큰 악영향을 끼칠 수 있다는 지적이다.챗 지피티 등 거대언어모델의 위험성을 지적하는 연구 결과가 나왔다.현지시각으로 21일 자마 네트워크 오픈(JAMA Network open)에는 거대언어모델의 위험성에 대한 연구 결과가 게재됐다(10.1001/jamaininternmed.2023.5947).현재 생성형 인공지능, 거대언어모델 등으로 표현되는 챗 지피티는 고도화가 지속되면서 의학계에서도 이에 대한 기대와 우려가 공존하고 있다.이미 다양한 연구를 통해 챗 지피티가 전문의 수준까지 이르렀다는 보고가 이어지면서 실제 임상 현장에 적용 가능성을 타진하고 있는 것.하지만 이에 대한 우려의 목소리도 적지 않은 것이 사실이다. 모델의 특성상 표절 등에서 자유로울 수 없으며 잘못된 정보를 재생산하는 문제가 있다는 것이 공통된 지적이다.호주 플린더스대 브래들리 맨즈(Bradley Menz) 박사가 이끄는 연구진이 실제 이같은 우려에 대한 적용 연구를 진행한 배경도 여기에 있다.과연 실제로 챗 지피티가 악의적 의도에 따라 정보를 왜곡하는지를 실제로 파악하기 위해서다.이에 따라 연구진은 이미 많은 의학정보와 연구가 있는 백신과 전자담배를 대상으로 왜곡된 정보를 지속적으로 챗 지피티에 주입하며 허위 정보를 유도한 뒤 확산을 시도했다.그 결과 65분만에 백신과 전자담배와 관련된 1만 7천 단어 이상의 허위 정보가 포함된 102개의 블로그 게시글을 생성하는데 성공했다.또한 이러한 블로그 게시글에는 가짜 환자와 가짜 의대 교수 등이 작성한 허위 정보가 포함됐으며 마치 연구 논문 등과 같이 과학적으로 보이는 참고 자료까지 생성하는데 성공했다.단지 텍스트 뿐만이 아니었다. 연구진이 다양한 방법으로 이를 시도한 결과 2분 내에 백신의 허위 정보를 담은 카드 뉴스와 가짜 환자 및 증상, 가짜 의사의 설명이 담긴 자료 사진 20개를 구현했다.영상 또한 마찬가지. 이같은 허위 정보를 담은 게시글과 사진을 통해 딥페이크 영상을 만들라고 주문하자 실제 의대 교수가 강연하는 것과 같은 영상을 만들어내는데 성공했다.특히 이러한 게시글과 사진, 영상은 5분 만에 40개 이상의 언어로 번역돼 계속해서 확산됐다.연구진은 이러한 시도가 거대언어모델의 위험성을 여실히 보여주는 것이라고 지적했다. 만약 특정인이나 특정 집단이 정보를 왜곡하고자 마음 먹는다면 얼마든지 매우 위험한 컨텐츠를 끊임없이 생산하고 확산할 수 있다는 것이다.브래들리 맨즈 박사는 "이 연구는 얼마나 쉽게 사실인것 처럼 보이는 사진과 영상을 대량으로 생산하고 확산할 수 있는지를 보여준다"며 "보건의료의 특성상 이러한 허위 정보는 생명을 위협할 수 있다는 점에서 문제가 심각한 상황"이라고 지적했다.그는 이어 "의료 전문가와 인공지능 개발자, 규제 기관이 힘을 합쳐 이를 검증하고 감시하며 관리할 수 있는 체제가 시급한 상황"이라고 밝혔다.
2023-11-22 12:17:39의료기기·AI

"챗 지피티 영어 의학 논문에 활용하고 싶다면 이렇게 써라"

메디칼타임즈=이인복 기자챗 지피티(Chat-GPT)를 활용한 연구와 논문 작성이 전 세계 학계에서 뜨거운 화두가 되고 있는 가운데 국내 전문가들이 선제적으로 이에 대한 활용 가이드라인을 내놔 주목된다.환각과 표절 등은 분명 문제가 될 수 있지만 효과적으로만 활용한다면 비 영어권 국가의 학자들로서는 '프로메테우스의 불'이 될 수 있다는 것이 이들의 의견. 지금은 밀어낼 단계가 아니라 어떻게 하면 더 효과적으로 쓸지를 고민해야 할 시점이라는 주장이다.영상의학과 전문의들이 챗 지피티를 활용한 영문 논문 작성 가이드라인을 내놔 이목을 끌고 있다.오는 10월 24일 대한영상의학회 국제학술지 KJR(Korean Journal of Radiology)에는 국내 첫 챗 지피티를 활용한 의학 논문 작성 가이드라인이 공개될 예정이다(10.3348/kjr.2023.0773).챗 지피티를 비롯한 생성형 인공지능(AI), 나아가 거대 언어 모델을 연구와 논문에 활용해도 되는가에 대한 문제는 최근 전 세계 학계에서 논란이 되고 있는 사안 중의 하나다.특히 사이언스(Science)지 등에서 챗 지피티 등을 활용을 사실상 원칙적으로 금지하면서 사실상 이에 대한 배척에 무게가 실리고 있는 것이 사실.이러한 가운데 국내 영상의학 전문가들이 이에 대한 활용을 전제로 한 논문 가이드라인을 내놓으면서 주목을 받고 있는 셈이다.그렇다면 이들이 이에 대한 활용을 전제로 한 배경은 무엇일까. 이같은 배경은 논문에도 자세히 서술돼 있다. 바로 언어적 장벽에 대한 해소다.영어가 모국어가 아닌 비 영어권 국가, 즉 우리나라의 경우 영어 능력의 부족으로 논문 작성에 매우 큰 어려움을 겪는 경우가 많다는 점에서 활용도가 높다는 것.사실상 무료로 24시간 개인 영어 교사처럼 활용할 수 있다는 점에서 영어 논문 작성에 대한 장벽을 낮추고 연구자가 특정 분야의 연구에 더욱 집중할 수 있는 만큼 이에 대한 활용에 제한을 둬서는 안된다는 것이 이들의 주장이다.이에 따라 분당서울대병원 영상의학과 황성일 교수를 비롯, 인하대병원 영상의학과 이로운 교수 등 저자들은 이러한 활용을 전제로 챗 지피티를 활용한 논문 작성법을 자세히 서술했다.일단 이들은 서문과 토론 부분을 작성하는데 챗 지피티를 사용할 것을 권장했다.영어가 모국어가 아닌 연구자들이 서론과 토론 부분의 작성에 있어 가장 어려움을 겪고 있는데다 이 부분에서 환각이나 표절 문제가 발생할 확률이 가장 적은 만큼 활용도가 높다는 의견이다.하지만 최근 학계에서 논란이 되고 있는 환각과 표절에 대해서는 분명히 경고의 목소리를 남겼다.일단 환각 부분에 있어서는 참고 논문의 세부 사항이나 진행중인 임상시험의 식별자와 같은 매우 구체적인 정보를 생성하는 작업에서 주로 일어나는 만큼 이를 경계해야 한다고 조언했다.이에 따라 만약 챗 지피티 등을 활용해 논문을 작성하더라도 반드시 펍메드(Pubmed)나 구글(Google) 등 전통적인 정보 검색 도구를 활용해 생성된 텍스트를 교차 활용해야 한다고 강조했다.표절에 대해서도 주의해야 할 점이 있다. 일단 전문가들은 언어 모델이 응답에서 기존 소스를 인용하도록 설계된 빙(Bing)이나 바드(Bard)에서 이같은 표절이 발생할 위험이 높다고 경고했다.또한 챗 지피티 같은 경우 가장 가능성이 높은 응답을 생성하기 위해 동일한 단어 문자열을 실수로 생송할 수 있다는 점에서 전통적인 표절 정의에 취약할 수 있다며 iThenticate이나 Turnitin 등과 같은 텍스트 유사성 탐지기를 활용해야 한다고 설명했다.이외에도 전문가들은 챗 지피티가 메시지의 내용을 수집한다는 점에서 환자 데이터가 개인 정보와 같은 민감한 정보를 입력하면 심각한 개인 정보 문제가 발생할 수 있는 만큼 옵션을 끄는 조치 등을 통해 이를 원천적으로 막아야 한다고 충고했다.하지만 그럼에도 이 부분만 잘 해결한다면 챗 지피티 등 언어 모델은 분명하게 영어 논문 작성에 도움이 된다는 것이 전문가들의 결론이다.연구진은 "영어 논문을 쓰기 위해 가장 일반적으로 쓰는 방법은 전문 편집 및 교정 서비스를 이용하는 것이지만 상당한 비용이 발생한다"며 "또한 이러한 원어민들은 특정 연구 분야에 전문가가 아니라는 점에서 연구 자체를 잘못 해석할 위험이 있다"고 지적했다.이어 "하지만 거대 언어 모델(LLM)은 영어 편집 서비스를 매우 쉽게 받을 수 있으며 프로세스가 상호 작용하므로 추가 비용을 들이지 않고도 수정이나 추가 설명을 요구할 수 있다"며 "특히 매우 다양한 버전의 교정을 제공해 연구자가 의도한 메시지에 가장 적합한 옵션을 선택할 수 있다"고 강조했다.이에 따라 연구진은 결론적으로 거대 언어 모델의 발전에 큰 기대감을 보였다. 문제로 열거한 환각과 표절 문제도 지속적으로 개선될 것이라는 점에서 비 영어권 연구자들에게는 더할 나위 없는 무기가 될 수 있다는 결론이다.연구진은 "거대 언어 모델이 발전하면서 비 영어권 연구자들이 활용할 수 있는 잠재력도 크게 커질 것"이라며 "챗 지피티 등의 한계과 환각이나 표절 등에 대한 잠재적 위험성만 정확히 이해한다면 논문의 품질을 크게 높이고 궁극적으로 과학 지식의 발전에 기여할 수 있을 것"이라고 밝혔다.
2023-10-07 05:30:00학술

양날의 검 chatGPT 활용안 머리 모아야

메디칼타임즈=이인복 기자바야흐로 생성형 인공지능(AI)의 전성시대다. 챗 지피티(Chat-GPT)로 촉발된 생성형 AI 바람은 이제 산업 분야를 넘어 전 사회에 영향을 미치고 있고 이 바람은 쉽게 멈추지 않을 분위기다.각 기업들은 일제히 이 바람에 편승하고 있고 학계도 예외는 아니다. 이미 일부 대학은 연구 등에 AI 활용을 장려하고 있고 일각에서는 이를 통한 표절 문제가 벌써부터 도마 위에 올랐다.의학 분야도 상황은 마찬가지다. 이미 다양한 분야에서 이에 대한 활용 방안이 논의되고 있지만 마찬가지로 연구 등에 활용이 윤리적인지에 대해서는 논란이 뜨겁다.이는 세계적인 현상이다. 이미 네이쳐나 사이언스 등 세계적 권위를 가진 학술지에서는 챗 지피티에 대해 매우 부정적 가이드라인을 내놓고 있다. 챗 지피티가 활용된 내용에 대해 강하게 제재하겠다는 지침이다.같은 의미에서 미국과 유럽 등 선진국에서도 마찬가지로 부정 기류가 지배적이다. 특히 의학 분야의 경우 환자의 건강에 직접적인 영향을 준다는 점에서 연구 윤리를 넘어  '환각'에 대한 경고의 목소리까지 나오고 있다.하지만 부정론만 있는 것은 아니다. 챗 지피티가 주는 이점을 간과해서는 안된다는 목소리도 있다. 국내에서 사실상 처음으로 나온 영상의학회 가이드라인 등이 대표적인 경우다.영상의학회는 가이드라인을 통해 비영어권 국가에서의 활용 방안을 제시했다. 환각과 표절 문제만 해결한다면 비영어권 학자들에게는 큰 도움이 될 수 있다는 것이다.이미 미국과 유럽을 중심으로 돌아가는 의학계에서 비영어권 국가의 학자들은 같은 가치의 연구를 진행해도 언어의 장벽으로 불평등을 겪고 있는 만큼 챗 지피티가 이를 해소할 수 있다는 시각이다.이로 인해 영상의학회는 챗 지피티를 프로메테우스의 불에 비유하며 영어를 잘하지 못하는 학자들을 위해 유용하게 써야 한다는 입장을 내놨다.윤리적, 법적 문제만 잘 해결한다면 양질의 논문을 보다 월등한 영어로 풀어내 더욱 많은 사람들과 공유할 수 있다는 것이다.하지만 문제는 이같은 긍정론과 부정론 사이에서 아직까지 뚜렷한 방향성이 나오고 있지 않다는 점이다. 이미 챗 지피티가 연구 분야에도 자연스레 스며들고 있지만 아직까지 이에 대한 학계의 합의가 없다는 의미다.실제로 국내에 챗 지피티에 대한 구체적 가이드라인을 내놓은 곳은 앞서 언급한 영상의학회가 사실상 유일하다. 일부 학회들도 이에 대한 제정의 필요성을 공감하고 있지만 여전히 결과물은 없는 상태다.이로 인해 학계내에서도 긍정론과 부정론은 여전히 충돌하고 있다. 실제로 모 학회에서는 가이드라인 마련 자체를 두고 내부 의견이 엇갈리며 아예 손을 놓아버린 사례까지 나왔다.대학에서도 마찬가지 상황이 벌어지고 있다. 챗 지피티를 활용한 보고서나 연구 등이 나오고 있지만 이를 제재해야 하는가를 두고 논란이 많다고 한다. 이를 허용할 근거도, 제재할 근거도 마땅치 않은 이유다.그러나 이 부분은 정부나 기관 등에서 해결해 줄 수 있는 문제가 아니다. 오직 학자들간에, 즉 학계에서 스스로 검토하고 검증해 방향성을 잡아야 한다는 의미다.이미 세계 유슈 학술지들은 자체적인 가이드라인을 내놓고 있고 미국과 유럽 학회 등도 마찬가지로 지침을 발표하고 있다. 만약 국내에서만 이에 대한 합의가 늦어질 경우 힘들게 쌓아온 국제적 신뢰를 잃을 수 있다는 의미다.시대의 변화에 맞춰 방향성을 제시하는 것 또한 학자의 중요한 역할이자 의무다. 공정하고 중립적인 가이드라인 마련은 더 이상 미룰 수 없는 학계의 과제다.
2023-09-25 05:00:00오피니언
  • 1
기간별 검색 부터 까지
섹션별 검색
기자 검색
선택 초기화
이메일 무단수집 거부
메디칼타임즈 홈페이지에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 방법을 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반할 시에는 정보통신망법에 의해 형사 처벌될 수 있습니다.