"신규로 개원하는 의사들에게 해당 지역 환경이 개원하기에 유리한지, 불리한지 가늠하고, 개원을 위해 중점적으로 고려해야 하는 특성이 무엇인지 제공해 주고 싶었습니다."
최근 건강보험심사평가원은 보건·의료 빅데이터의 활용도를 높이기 위한 방안 마련을 위해 '개원 지역 예측 모델' 개발을 주제로 '제12회 SAS 마이닝 챔피언십'을 개최했다.
대회 핵심과제는 요양기관 현황 및 진료 정보를 활용해 각 지역별 병·의원 매출 및 해당 지역 개원 위험도 분석 및 매출 예측을 통해 병·의원 개원 공급, 수요 정보를 제공하는 것이었다.
메디칼타임즈는 'SAS 마이닝 챔피언십' 우승자들인 강원대 이재홍(경영학과), 김동영(컴퓨터정보공학과), 조경민(정보통계학과) 학생을 만나 우승작인 '개원지역 예측 모델'에 대한 내용과 실제 적용 가능 여부에 대해 들어봤다.
심평원에서는 '개원 지역 예측 모델'을 주제로 대회를 진행했다. 대회 핵심과제에 대한 수행결과와 향후 적용할 수 있는 모델인지 궁금하다.
이번 대회는 개원 지역 예측 모델을 개발해야 한다는 주제 하에 의원급 의료기관과 약국을 대상으로 개원시점 기준 13개월 차 매출액과 2년 내 폐업가능성을 예측하는 것이었다.
이를 해결하기 위해 심평원으로부터 제공받은 전국 요양기관 데이터 등을 분석해 최종 개발한 예측모델은 신규개원을 희망하는 의사들에게 개원지역, 진료과목, 의료인 수, 장비현황 등 몇 가지 정보만으로 대략적인 13개월 차 매출액과 2년 내 폐업가능성을 예측해 줄 수 있었다.
따라서 이 모델을 통해 신규개원을 하는 의사들에게 해당 지역의 시장 환경이 개원하기에 유리한지 또는 불리한지를 가늠할 수 있으며 신규개원을 위해 중점적으로 고려해야하는 특성들이 무엇인지를 정확하게 이해할 수 있을 것이라 생각한다.
개발한 예측모델로 도출해 낸 결과를 적용한다면 실제로 위험도를 낮출 수 있나.
분명히 가능하다. 개원 위험도가 상당부분 감소할 것이라고 생각한다.
빅데이터를 활용을 바탕으로 한 예측모델 분석결과는 기존의 샘플분석을 배경으로 한 정보들 보다 예리하고 정확하며 폭넓게 적용 가능하다.
기존의 샘플을 활용한 분석결과는 특정 상황이나 의료기관에 치우쳐 있지만 빅데이터을 활용한 분석결과는 전국의 모든 의료기관 데이터들을 대상으로 실시했기 때문이다.
특히 예전에는 개원 지역 근거리 내 동일진료과목이 많을 경우 불리하다는 것을 직감적으로 추측했지만 빅데이터를 활용한 개원예측 모델은 매출액이나 폐업여부를 값으로 도출해 정확히 개원하는데 얼마만큼의 어려움을 주는지 수치적으로 이해하는 것이 가능하다.
수요 예측에 따라 실제 개원한다면 그에 따른 적중률은 얼마나 된다고 평가하나.
분석모델이 한 개인의 미래를 보여주거나 개원 후의 성공여부에 대해 보장해 주는 것은 결코 아니다.
특정 지역의 해당 진료과목 개원에 대해 분명한 근거를 바탕으로 잠재적인 수요를 예측하는 것은 가능하지만 실제 개원하는 의료기관이 이러한 잠재수요를 전부 충족시킬지는 최종적으로 의사들의 역량과 운에 달려있다고 생각한다.
빅데이터 분석은 미래의 성패를 예측해준다는 영화같은 시각보다는 개원 전, 후 불확실성을 상당부분 완화시켜주고 진출하려는 시장 환경의 매력도를 이전에 비해 상당히 객관적으로 전달해 줄 수 있는 수단이라고 본다.
의사들의 자문도 구했는가.
본격적인 분석을 시작하기 전 배경지식이 매우 한정적이라는 부분에 문제를 느꼈고 가능한 선에서 여러 전문가들에게 자문을 구했다.
가장 큰 도움을 준 분은 강원대 의학전문대학원 교수님이다. 짧은 시간이었지만 병원 매출액 및 폐업에 유의미한 변수로 예상되는 것, 진료과목별 특성 등 여러 가지 전문적인 부분에 대해 자문을 받을 수 있었다.
빅데이터 분석으로만 끝나지 않고 이를 실제 사례로 적용하려면 어떠한 것들이 추가적으로 필요하나.
분석과정에서 의료기관별 규모에 대해 정확하게 판단할 데이터가 없었다. 각 기관의 규모에 대해 정확히 구분할 수 있도록 개원 의료기관의 면적, 임대료 등의 데이터가 있다면 정확한 분석이 되지 않을까 생각한다.
또한 데이터 상에 의료기관들의 폐업여부가 구분돼 있었다. 폐업의 원인에는 적자문제, 개인사정, 새로운 개원 또는 다른 이유 등이 있다고 생각한다.
데이터 수집단계에서 또는 폐업원인을 구분할 수 있는 분석모델을 만드는 등 폐업의 상세원인을 변수에 반영할 필요가 있다.
이러한 데이터들을 기반으로 분석을 진행해 모델을 개발한다면 실제사례로 적용가능 할 뿐 아니라 놀라운 효과를 기대할 수 있을 것이다.