데이터정합률 99.99%, PACS 통합 가능 "의료표준화 연구 선도"
한림대성심병원(병원장 유경호)은 2일 데이터 레이크 클라우드 플랫폼 '히어로'(HERO: Harmonic intEgrated Reasearch platfOrm)를 개발했다고 밝혔다.
히어로는 연구자가 가장 효율적으로 빅데이터 및 인공지능(AI) 관련 연구를 이끌어나갈 수 있도록 돕는 빅데이터 활용‧분석 플랫폼이다.
연구자의 임상경험과 AI를 진료에 접목시킬 수 있는 연구를 최적화할 수 있는 플랫폼을 만들자는 아이디어에서 태어난 히어로는 약 6개월간 SK㈜ C&C와 협업을 통해 개발됐다.
데이터 레이크는 각 기관에서 수집된 다양한 데이터를 원시 형태(raw data)로 저장해 다양한 유형의 빅데이터를 관리하는데 최적화된 데이터 저장소를 말한다. 즉, 데이터 마트가 쉽게 마실 수 있도록 정제 및 포장된 생수 저장고라고 한다면 데이터 레이크는 보다 자연적인 상태의 큰 호수 자체를 의미한다.
두 기관은 한림대의료원 병원별 온프레미스 환경에서 표준화된 데이터 파이프라인을 구축하고, 데이터 생산장비 보완, 저장장비 내 데이터추출 기법 등을 새로 개발하여 데이터 레이크를 구축했다.
히어로는 프라이빗 클라우드와 퍼블릭 클라우드가 접목된 하이브리드 클라우드 환경에서 운영되며, 유연한 환경설정 안에서 데이터를 쉽게 파악하고, 분류 및 분석을 할 수 있다.
기존 '임상 데이터 웨어하우스'(CDW)가 제공하던 사용자 인터페이스·사용자 경험(UI·UX)도 대폭 개선하여 연구자 친화적 플랫폼을 완성했다. 또 퍼블릭 클라우드 내에서 머신러닝을 통한 결과 예측모델 개발도 가능해서 기존 데이터베이스나 데이터웨어하우스보다 한층 진보된 플랫폼이다.
최근 한국데이터산업진흥원 주관 데이터품질인증제도를 통해 데이터 표준, 업무 규칙, 데이터 패턴, 허용 범위, 코드값, 무결성, 표준정의 등 품질에 영향을 미치는 요소들을 종합적으로 심사받아 정합률 99.99%를 받았다.
특히 히어로는 SK㈜ C&C가 개발한 데이터 분석 플랫폼 아큐인사이트 플러스를 탑재했다. 데이터 분석, 모델 생성, 배포, 관리 등의 연구를 빠르고 매끄럽게 진행할 수 있고, 고도화된 데이터 분석이 가능하다.
또 클라우드 환경을 통해 다기관 연구자들이 같은 공간에서 데이터 활용이 가능한 공동연구 생태계를 구축할 수 있다.
의료영상저장전송시스템(PACS) 내 이미지를 범용 이미지 파일 형태로 변환하여 통합 관리하고 검색 조건에 따라 일괄 다운로드 받을 수 있다는 것도 히어로만의 장점이다.
서영균 빅데이터센터장은 "히어로를 통해 국책사업인 데이터중심병원 컨소시엄 등 다기관 데이터 공유 및 협력연구 생태계를 조성했다"면서 "플랫폼을 더욱 고도화시키고, 다양한 공동연구를 주도하는 등 한림대성심병원이 의료데이터 표준화 및 의료 빅데이터 연구를 선도하는 역할을 이어나갈 수 있도록 최선을 다하겠다"고 말했다.
한림대성심병원 빅데이터센터는 최근 한국데이터산업진흥원 주관 데이터품질인증제도에서 공통데이터모델(CDM, Common Data Model) 의료데이터로 데이터품질인증 부문 최고 등급인 '플래티넘' 등급을 획득했다.