100만명의 건강정보가 담긴 빅데이터를 앞으로 각종 보건의료 관련 연구에 이용할 수 있게 된다.
국민건강보험공단은 가입자의 진료내역, 검진결과, 요양기관정보 등을 바탕으로 층화계통추출방법을 통해 연구용 표본 데이터베이스(DB)를 구축했다고 22일 밝혔다.
층화계통추출은 조사할 집단을 동일한 몇 개의 층으로 나누고 층화된 집단에서 각각 일정 규모의 표본을 추출하는 방식이다. 예를들어 연령은 5세 단위로 구분해 각 집단에서의 표본을 추출한다는 것.
이번 DB는 지난해 7월부터 6개월간 고려대 의대 이준영 교수팀의 연구결과를 바탕으로 구축했다.
구축된 자료는 ▲성별, 연령별, 소득분위별 등으로 구분해 추출된 '표본코호트DB' ▲크론병 등 3개 희귀질환을 대상으로 하는 '희귀질병DB' ▲2001~2010년 5번의 건강검진을 모두 받은 수검자 240만명를 대상으로 하는 '건강검진DB' 등 총 3가지 종류다.
여기에는 2002~2010년 개인정보를 제외한 진료내역, 검진결과 등의 건강상태, 사망까지의 내용 등이 들어있다.
건보공단은 "지금까지 자료규모의 방대함과 개인정보보호 문제 등으로 연구자의 접근과 활용이 제한적이어서 공익적 연구는 부족했던 측면이 있었다"고 설명했다.
이어 "공단은 전 국민의 진료내역, 검진자료, 거주지 및 보험료 등 질적으로 우수한 자료를 보유하고 있다. 이는 국가정책 수립, 각종 학술연구 등에서 유용하게 사용될 수 있을 것"이라고 내다봤다.
건보공단은 앞으로 구축된 표본DB를 학회와의 협력, 심포지엄 등을 통해 검증을 거치고 학술연구에 활용할 수 있도록 공개할 계획이다.
구체적으로 표본코호트DB를 공익연구목적에 한해 심의, 제공될 예정이고 건강검진DB도 단계적으로 제공여부를 검토할 계획이다.