코스피 2,969.27 13.95 (-0.47%)
코스닥 1,001.35 0.08 (-0.01%)

[똑똑!빅데이터]진료차트를 읽어주는 빅데이터

  • 등록 2017-06-17 오전 7:28:49

    수정 2017-06-17 오전 7:28:49

[이데일리 이유미 기자] 사람들은 매일 페이스북에 사진을 올리고 스마트폰으로 기사를 읽고 신용카드로 결제를 합니다. 큰 의미없는 일상생활인 것 같지만 행동 하나하나가 모두 데이터로 쌓이고 있습니다. 이른바 ‘빅데이터’ 시대입니다. 요즘 뜨고 있는 인공지능(AI)도 빅데이터 덕분에 더욱 발전하고 있는거죠. 빅데이터가 왜 중요한 걸까요. 사례를 통해 데이터 이야기를 해보겠습니다.

환자에 대한 진찰 및 의료 기록의 80%는 의사의 수기라고 합니다. 어려운 영어로 휘갈겨 쓰여졌기 때문에 의사나 간호사가 아니면 무슨 의미인지 알아내기 어렵습니다.

이러한 형식에 맞게 정리되지 않은 자료들을 ‘비정형 데이터(unstructured data)’라고 합니다. 디지털화 되지 않은 이와 같은 비정형 데이터는 컴퓨터가 읽어내기 쉽지 않기 때문에 과거에는 데이터를 분석하거나 활용하기가 어려웠죠. 환자 진찰 및 의료 기록에는 많은 정보가 담겨있는데도 말이에요.

다렌 슐렛트 아픽시오 대표는 “개인을 보다 잘 관리하고 인구의 건강에 대해 더 많이 이해하는 방법을 배우고 통찰력을 얻기 위해서는 비정형 데이터를 발굴할 수 있어야 한다”고 말했습니다.

의료 서비스는 데이터 규모의 문제가 아니라 디지털화하지 못해 체계적으로 분석하지 못했던 비정형이었던 것이 문제였습니다.

아픽시오(Apixo)는 이러한 문제를 해결하려고자 했습니다. 아픽시오는 2009년 캘리포니아에 설립된 인지컴퓨팅(cognitive computing) 회사입니다. 의료 기록을 디지털화해 임상적 지식에 대한 접근 가능성을 높여 건강 관리 관련 의사 결정을 향상시키는데 도움을 주고 있습니다.

아픽시오는 기계학습을 기반으로 자연언어 처리 기능을 활용했습니다. 아픽시오는 OCR(광학적 문자 판독장치)를 활용하고 정교한 기술을 개발해 알고리즘을 개발해 손으로 씌여진 의료차트를 컴퓨터가 읽을 수 있게 한 것입니다. 이미지를 사전 처리하고 OCR 엔진에 매개 변수를 설정하고 출력을 수정하는 정교한 작업을 통해 스캔한 진료 차트를 컴퓨터가 이해할 수 있는 텍스트로 변환했습니다.

환자 데이터 모델을 생상하기 위해 환자 각각의 데이터를 분석하는 것은 물론, 질병 유행, 치료 패턴 등 통찰력을 이끌어내기 위해 인구 전체에 대한 데이터를 수집하기도 합니다.

컴퓨터로 분석할 수 있는 데이터의 양이 방대해지자 질병이나 의학적 요소들 사이의 관련성도 파악할 수 있었습니다. 아픽시오는 수백만종류의 건강관리 개념과 용어를 입력하고 이들 간의 관련성을 이해할 수 있는 자체 ‘지식 그래프’를 만들었습니다.

아픽시오가 선보인 제품은 HCC Profiler였습니다. 이 제품은 전자 기록이나 요금청구 등 이미 디지털화된 자료 외에도 비정형 자료로 이전에는 분석할 수 없었던 의료 데이터의 80%에 접근해 분석을 할 수 있도록 했습니다.

아픽시오의 제품은 사람이 직접 검토하는 것보다 한 시간안에 2~3배나 많은 차트를 읽을 수 있었습니다. 또 사람이 직접 차트를 읽는 것보다 HCC Profiler를 통해 정확도도 20%까지 높일 수 있었습니다.

또 최근 진료를 하지 않았던 환자더라도 기록을 통해 만성질환을 찾아낼 수 있었습니다. 예를 들어 아픽시오는 2만5000명의 환자군에서 9개월동안 5000가지가 넘는 질병을 발견했습니다.

아픽시오의 처음과 끝은 데이터 분석에 있습니다. 컴퓨터가 읽지 못하는 자연어로 된 글씨들을 디지털화할 수 있었던 것은, 많은 양의 글씨들을 통해 컴퓨터를 학습화시킨 덕분입니다. 비정형 데이터를 결국 컴퓨터가 이해할 수 있도록 정형화 데이터로 바꾸는데 성공을 한 것입니다. 정형화된 데이터는 컴퓨터가 분석할 수 있는 데이터의 양이 더욱더 많아지는 결과를 낳아 개개인의 데이터를 해석하는 것은 물론 많은 수의 환자 데이터를 분석하고 이 패턴들을 통해 질병과 건강요인과의 관계 등을 파악할 수 있었던 것입니다.

소셜 댓글by LiveRe

많이 본 뉴스

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 발행인 곽재선 I 편집인 이익원

ⓒ 이데일리. All rights reserved