메디칼타임즈가 대한디지털헬스학회와 함께 진행하는 영상 인터뷰 코너 'K-헬스 리더를 만나다' 시간입니다. 이번 주 주인공은 퍼즐에이아이(Puzzle-AI) 전하린 본부장입니다.
국내 대표 의료 인공지능(AI) 음성인식 전문기업으로 불리는 퍼즐에이아이.
퍼즐에이아이는 'Voice EMR'을 필두로 국내 임상현장에 특화된 인공지능 음성인식 기술을 통해 국내 대표적인 의료 인공지능(AI) 음성인식 전문기업으로 불리고 있습니다.
그렇다면 전하린 본부장이 생각하는 코로나 대유행 이후 디지털 헬스 뉴노멀의 개념은 무엇일까요. 디지털헬스학회 고상백 회장(원주세브란스병원), 김현정 부회장(서울대 치과병원)과 함께 전하린 본부장이 생각하는 퍼즐에이아이의 글로벌 진출 전략을 들어보시죠.
Q. 우선 전하린 본부장님, 자기소개 부탁드립니다.
- 안녕하세요. 퍼즐에이아이에서 연구, 개발을 담당하는 전하린 본부장입니다. 퍼즐에이아이는 의료 분야에서 발생할 수 있는 다양한 문제를 음성 AI 기술로 적용해 해결하는 솔루션을 개발하는 회사입니다.
Q. AI에서도 음성은 어려운 분야로 손꼽힌다. 선택한 배경은?
- 제가 학교에 다닐 때부터 인공지능(AI) 연구를 많이 수행해왔습니다. 보편적으로 영상 AI의 경우 많은 연구와 개발진이 포진해 있습니다. 그 외 음성 AI는 상대적으로 연구진이 부족하다는 판단 하에 집중했습니다.
Q. 사명이 독특하다. '퍼즐에이아이'에 담긴 의미는?
- 퍼즐에이아이는 퍼즐(Puzzle)과 AI 두 개로 나눌 수 있습니다. 세상의 모든 문제를 퍼즐(Puzzle)로 보고 이를 해결하는 도구를 AI라고 이해하면 될 것 같습니다. 그래서 현재는 의료 분야에 집중해 의료진과 환자가 당면한 문제를 해결하는데 집중하고 있습니다.
Q. 코로나 이후 디지털 헬스케어 뉴노멀의 개념을 설명한다면?
- 뉴노멀은 대격변 이후에 익숙해진 상황을 말합니다. 코로나 상황 이후에는 의료분야 뿐만 아니라 다양한 분야에서 언택트(Untact, 비대면) 키워드가 등장했습니다. 그러면서 컴퓨터와 전산화가 익숙해지고 새로운 기술 수요도 급증했습니다. 디지털 헬스의 AI 기술 수요도 많이 늘어난 시기인 것 같습니다. 보통 의학에서 4P 의학(4P Medicine)을 지칭하는데 이 과정에서 AI 기술 접목이 활발한 것 같습니다. 그 중에서도 정밀의료와 참여의료 관점에서 AI는 보편화돼 이젠 없어서는 안 될 기술이 됐습니다. 이를 AI 뉴노멀이라고 지칭해야 할 것 같습니다. 대표적으로는 루닛이나 뷰노 등 영상 기반 AI 기업들도 임상현장 사전 스크리닝 영역에서 빠질 수 없는 기술이 됐습니다.
Q. 퍼즐에이아이 VoiceEMR, VoiceENR 기술도 궁금하다.
- VoiceEMR도 마찬가지로 Voice와 EMR의 합성어입니다. 음성으로 전자의무기록을 작성하는 프로그램입니다. 보통 외래 현장 가면 환자 얼굴을 보고 의료진이 진료를 봐야 하는데 모니터를 보고 진료를 보는 것이 일상입니다. 차트를 입력하는데 시간을 뺏기기 때문인데요. 말을 하면서 기록이 자동화 되는 솔루션인데, VoiceEMR이 의사 분들이 사용하는 것입니고, VoiceENR은 간호사 용으로 개발된 솔루션입니다.
Q. 병원 등 임상현장에서의 AI 기술 적용이 어려웠을 것 같은데요.
- 저희도 기술 개발 당시 음성인식만 하면 되겠다는 안일한 생각을 했습니다. 임상현장에 알림음과 경고음, 보호자 분들도 말씀을 많이 하십니다. 기록을 온전히 인식하는데 어려움이 많았습니다. 기반 기술로 노이즈(noise)를 제거와 화자 분리 필터 연구 개발에 집중했습니다. 저희가 4년 정도 연구가 수행돼 내재화가 모두 된 상태입니다.
Q. VoiceEMR, VoiceENR이 실제 임상 현장서 활용되나요?
- 대표적으로는 2, 3차 대형병원에서 선제적인 도입하고 있습니다. 일례로 VoiceENR이 가장 최근에 수요가 많은데요. 은평성모병원 등 간호사 분들이 환자 활력징후(Vital Sign)와 기록을 수기로 하던 것을 음성으로 대체하고 있습니다.
Q. 임상현장 특성 상 국내‧외 언어를 혼용한다. 해결해야 할 문제점 같다.
-엔지니어 입장에서 판단해보면 사투리로 영어를 말씀하시는 것이 가장 어려웠습니다. 발음에 있어서 영어를 지역 사투리로 말씀하는 경우가 많았습니다. 다양한 데이터를 모으는 것이 가장 중요했습니다. 실제 작업할 당시 전공의와 의대생 대상으로 1000시간의 음성 데이터를 모으는 것으로 시작했습니다. 지금은 수십배의 데이터를 쌓았지만 사투리 이슈가 가장 어려웠습니다.
Q. AI 음성 인식률이 중요한데, 임상현장에서 발생할 것 같은데.
- 보통 구글이나 애플 Siri, 삼성 빅스비 솔루션을 생각하실 것 같다. 의료용 한글과 영어를 혼용하면 영어단어들은 비슷한 한글로 치환하는 것을 확인하실 수 있을 것입니다. 그래서 처음 개발할 때도 한글과 영어를 동시에 알아들으면서 오류는 최소화하는 방향으로 개발했습니다. 오류가 있으면 안 되는 의료분야이기 때문이죠. VoiceEMR 기준으로 98%의 인식률을 보이고 있습니다.
Q. 비즈니스 모델이 병원이다. 현재 개발상황이 궁금하다.
- VoiceEMR, VoiceENR을 대표로 해 의사, 간호사에 집중하고 있지만 현재는 외래분야도 도전하고 있습니다. 의사와 환자의 음성을 따로 인식하는 것입니다. 향후에는 PHR(Personal Health Record)이라는 환자의 직접적인 기록들이 더욱 유용한 데이터가 될 것입니다. 의무기록으로서도 가치가 높아질 것인데, 외래 현장을 시작으로 환자의 음성을 직접 인식하는 것을 목표로 개발하고 있습니다.
Q. 글로벌 시장 진출 위한 영어 전환 등 기술 개발 상황은 어떤가요?
- 기본적으로 한글과 영어를 모두 인식이 가능한 국제발음표준(IPA)을 기준으로 만들고 있습니다. 물론 영어 최적화 작업이 필요하지만 글로벌 시장에 진출하는 것은 큰 어려움은 없을 것 같습니다. 다만, 영어도 사투리가 있기에 조심해야 할 것 같습니다.
Q. 퍼즐에이아이의 향후 개발 계획은 무엇은가요?
- 저희가 단순하게 음식을 인식해서 기록으로 옮겨주는 것만 한다면 충분히 대체 가능합니다. 장기적으로는 음성으로 남겨진 기록을 요약하고 정보를 추려서 기록으로 저장하는 것이 목표입니다.
Q. 누적 100억원 이상 투자도 받았다. 주요 파이프라인을 소개한다면?
- 저희가 의료분야에서는 영상의학과, 병리과, 핵의학과 위주로 확산되고 있습니다. 그 외 소화기내과, 수술실, 외래 환경에 맞춰진 솔루션도 개발했습니다. 앞으로는 금융과 법률 등 다양한 분야에서도 음성 인식활용 사례가 있기 때문에 해당 분야에도 확대할 예정입니다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글