고려대학교 안암병원 순환기내과 주형준 교수팀(순환기내과 주형준 교수, 김종호 교수, 언어학과 송상헌 교수, 한양대학교 김영민 교수, 가톨릭대학교 김유중 교수)은 26일 인공지능으로 한국어 의료 자연어 처리기술을 개발했다고 밝혔다.
이번에 개발된 기술은 몇 문장만 입력하면 적절한 진료과를 추천해주는 인공지능 기반의 기술이다.
연구팀은 올해 초 2만 6986개의 의학용어를 정리하고, 한국어 일반 자연어처리 모델인 KR-BERT를 기반으로 의학관련 지식(논문 및 기사 등) 통해 약 600만개의 문장과 약 1억 1600만개의 단어를 학습시켜서 의료분야에 특화된 자연어처리 모델인 KM(Korean Medical)-BERT를 개발하였다.
KM-BERT는 기존 일반 자연어처리 모델인 M-BERT, KR-BERT에 비해 의료분야 한국어 자연어처리 성능에 있어서 월등한 성능을 보여 국제학술지에 소개되면서 국제적인 주목을 받은 바 있다.
이번 연구는 KM-BERT에 대한 후속 연구로서 실제 의료 및 헬스케어에 활용해봄직한 실질적인 업무에 KM-BERT를 적용해보았다. 질문자가 몇 문장을 입력하면, 인공지능이 질문자의 문장에서 핵심단어를 찾고 가장 적합한 진료과 3곳을 추천한다.
예를들어 "중앙 갈비뼈 통증 숨 들이마쉴때랑 기침할 때 여기가 너무 아파요. 왜그런거죠"라고 입력하면, 인공지능이 학습한 내용을 기반으로 33.9%의 예측확률로 호흡기내과, 31.6%로 흉부외과, 9.8%로 가정의학과를 추천한다.
주형준 교수는 "양질의 데이터셋을 통해 완성도 높은 언어모델을 구축할 수 있었다"며 "이번 언어모델 개발과 고도화는 KM-BERT를 활용하여 실제로 적용가능한 의료서비스 개발이 가능하다는 것을 보여주었다는 점에서 의미가 있으며, 앞으로 의료 및 헬스케어 분야에 여러 가지로 활용 가능할 것으로 기대한다"고 말했다.
한편, 이번 연구 'Predicting medical specialty from text based on a domain-specific pre-trained BERT'는 국제저명학술지 'International Journal of Medical Informatics' 최신호에 게재됐으며, 연구팀은 관련 특허를 확보하는 등 연구개발과 실용화에 박차를 가하고 있다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글