Large-scale RWE and Identification of Biomarkers through CDM

  • 공통데이터 모델 배경 및 필요성
    • 기술적으로 여기저기 흩어져 있는 다양한 형태의 데이터를 모으기 어렵고, 법적으로 개인정보보호법의 문제가 있고, 인간본성의 문제가 있다.
    • 병원마다 데이터 구조가 다르기 때문에 데이터 구조를 통합시켜서 R, Saas, sql로 일괄된 소스 코드를 짜서 결과값을 확인할 수 있게 하는 구조이다.
  • OHDSI
    • OHDSI 툴 개발 진행 중이다. 110개 오픈소스 툴이 개발 완료되었거나 개발 진행 중이다.
    • 아킬레스: 데이터 특징 시각화 툴
      • Ami.ajou.ac.kr:8080
    • 오픈 이노베이션 : 프로그램 공동 개발, 공동이용 프로그램에서 저절로 데이터 추출하고 R 프로그램을 저절로 만들어서 분석한다.
  • Big Data Confirm Type 2 Diabetes Treatment Approach
    • 2억 5천만명 데이터 사용
    • 3가지 약물 중에 어떤 것이 치료에 더 좋은가 확인
  • Comparison of initial combination treatment
    • 어떠한 약물 조합이 더 좋은지 확인
    • 연구자가 데이터를 보지 않고 분석 가능
  • Development of Clinically Informing application using Recurrent Neural Network (CIReNN) based on Common Data Model
    • RNN을 쉽게 적용할 수 있는 패키지 개발(CIReNN)
    • 아킬레스 툴을 이용해서 데이터를 추출하고 패키지로 hyperparameter 설정하고 돌리면 분석, 시각화
  • AI는 엑셀 같은 툴이 될 것이다. 알고리즘을 만드는 사람이 아니면 툴은 중요하지 않고, 도메인 지식이 더 중요하다.

  • Identification of Biomarkers through CDM
    • 기존 CDM에 유전체 데이터를 넣을 수 있도록 확장시킴
    • 이 툴을 이용하면 퀵인사이트를 얻을 수 있다.
    • 패키지가 공개되어 있다.
  • FEEDER Platform
    • 42개 병원, 5천 5백만명 데이터 네트워크 플랫폼
    • 개인 데이터는 들어오지 않고 통계값만 들어온다.



Personal and Private Big Data: Genomes and Health Records

  • 약물 사고가 사망 원인 4위이다. 의료 공급이 충분하기 때문에 최적화하는 방향으로 가고 있다.

  • 약물유전체학
    • 약과 유전체가 상호 반응한다. 약물을 먹었을 때 몸이 반응하는 경우가 있다. (약물 반응 떨어짐, 약물 분해가 좋지 않음)
    • 의사로서 미리 데이터를 확보해서 약물 처방할 때 활용하자
    • 100명의 컨트롤과 100명의 환자를 분석하는 것은 쉽지만, 한 사람의 데이터를 두고 해석하면 쉽지 않다.
    • 특정 위치의 서열을 보고 카페인이 분해가 잘 되는지 알 수 있다.
    • 요즘은 시퀀싱 50만원이면 할 수 있다. 우리나라는 유전체를 사주팔자처럼 생각한다.
    • 술 마시고 얼굴 빨개지는 것은 아시아인만 해당 (인종 별로 차이가 큼)
  • 나는 농경민족일까 유목민족일까?
    • 네덜란드인 평균키가 큰 이유는 nonrandom mating 때문이다. (키 큰 사람들끼리 결혼) nonrandom mating 파워풀하다.
    • 농경에 노출되지 않은 사람들(아프리카 등)과 비교했을 때 일본인 비만인자 많음
    • 50~100개 정도 태어날 때부터 mutation으로 생긴 자신만의 유전자
  • PharmSafe: Clinical Validation
    • Factor 10 이 suppresion된 사람한테 Factor 10 inhibitor 를 처방하면 약 먹다가 죽을 수 있다.
    • 문명화될 수록 bleeding 되는 시간이 길다.
    • 운이 나쁘면 어떤 사람은 처방된 약물에 의해 죽을 수 있다.
    • 모든 사람에게 50개 정도의 약물은 위험하다는 결과를 얻을 수 있다.
  • Homozygous mutation은 태어날 때 걸러지고, Heterozygous mutation은 약물과 음식을 조심해야 한다.

  • Personal Pharmacogenomics
    • 의사가 처방한 약을 그대로 먹는 게 좋은 것만은 아니다.
  • 소아 희귀 암에서 맞춤약물치료 기술 개발의 필요성
    • 소아 희귀 암에서의 약물은 인종 차가 크다. 한국인에게 없는 변이를 타겟팅한 약물은 효과가 없다.
  • 40세 이상이 되면 heterozygous mutation의 영향을 받아서 어떤 물질들이 쌓인다.
  • Rare variant의 문제. 동물 실험은 불가능하다. 40세 이후 생기는 질병들과 관련되어 있다. 약물, 음식, 환경에 대한 반응은 여기서 결정될 가능성이 높다.



Experience of Mobile Personal Health Record and Patient Generated Health Data

  • Next Generation Healthcare
  • Predictive Personalized Preemptive Participatory Precision
  • Patient Engagement

  • Patient-generated Health Data (PGHD)
    • 실제 환자가 모으거나 받은 데이터 (병력, 치료 이력, 바이오센트 데이터, 증상 등)
  • m-PHR & PGHD
    • 환자가 생성한 데이터를 통합한 어플리케이션
    • 미국에서는 2020년까지 75%의 성인이 PHR을 이용할 것이라고 예측
  • 입원 환자 중심의 PHR(Personal Health Record)
    • 실제 자신의 검사 결과, 먹고 있는 약, 의료진 등을 알 수 있다.
  • AMC m-PHR: 내 손 안의 차트
    • 서울아산병원에 국내 유일의 모바일 PHR이 있다. 2010년 말부터 제공된 서비스
    • Realtime 데이터 제공



의료 4차 산업혁명: 의료 빅데이터와 병원정보시스템

  • 1~2차 산업혁명은 공급의 혁명, 4차 산업혁명은 초연결성-초지능성 기반 맞춤형 생산체계로 전환
  • 빅데이터, 클라우드, AI로 인해서 소비자 맞춤형 서비스가 생긴다.

  • 의료 스마트 맞춤형 헬스케어
    • 개인 체질과 특성에 따른 건강관리 구현, 실시간 신체정보에 기반하여 신속한 건강관리 실현
  • 정밀의료병원정보시스템(P-HIS)
    • 데이터를 표준화 시키고, 여러 병원의 정보를 한 병원의 정보인 것처럼 사용할 수 있다.
    • 용어, 프로그램 표준화시켜서 데이터를 클라우드에 올린다.
    • 각자 발전기를 돌려서 전기를 생산하던 시스템에서 국가에서 전기를 생산하는 시스템으로 바뀌고, 맞춤 양장점에서 기성복점으로 바뀐 것처럼 의료 정보시스템도 병원 별 맞춤 시스템을 통합해서 표준화된 플랫폼을 구축하는 것이다.
    • 네이버의 데이터베이스 관리자조차도 데이터에 접근할 수 없다. 접근하는 순간 철컹철컹
  • 고대 의료원에서 IBM watson과 항생제 선택 프로그램을 개발 중이다.
  • 암은 만성 질환이 될 것이고, 항생제 내성 박테리아가 큰 문제가 될 것이다.
  • 항암제는 많이 나오고 있지만 항생제는 1년에 1~2개 나오는 실정이다.
  • 내성균이 많이 나온 항생제는 이것이고, 이 항생제를 처방했더니 이런 내성이 생겼고, 그래서 이 항생제를 선택한다는 식의 AI 개발 중

  • 의료분야 블록체인 적용 예시
    • 병원에서 진료는 적자가 되고, 연구는 흑자가 되어가고 있다.
    • 의료 데이터가 잘 돌아갈 수 있는 생태계를 만들 수 있다.



유전체 빅데이터 기반의 암진단 및 건강관리 (김경철 박사)

빅데이터 트렌드

  • 15년 정도 사이에 유전체 시퀀싱의 가격, 시간이 확 떨어졌다. IT분야의 발전 속도에 비해서 BT분야 발전 속도는 100만배 높다.
  • 옥스포드 나노포어
  • 구글의 음성인식의 정확도는 95퍼센트이다.


빅데이터를 통한 암 진단

  • 2018년 4월 Google AI Health Care
  • 현미경에 조직을 올려놓으면 pixel을 데이터와 mapping해서 암인지 아닌지 진단한다.
  • 육안으로 진단할 때는 정확도가 78퍼센트였는데 AI기법의 진단은 정확도가 98퍼센트였다.

  • 빅데이터 AI기반의 기업 : 소피아제네틱스
    • AI, 머신러닝을 적용해서 유전체 분석, 분자진단
  • 딥러닝을 이용해서 암과 정상을 분류할 수 있는가?
  • 데이터 분석 기술 혁신 : 딥러닝
  • 공개적으로 이용가능한 데이터 누적 : TCGA, GTEx, GEO
    • TCGA는 암 조직과 암 주변 정상 조직에 대한 정보를 모아 놓은 데이터 베이스
    • GTEx는 암이 아닌 다른 원인에 의해 사망한 데이터를 모아놓은 데이터 베이스
    • 조직, 병리, 유전체 데이터 활용
  • 전체 서버의 5분의 1을 차지할 정도의 양 (1PB)
  • 스마트 빅데이터를 어떻게 추출해내느냐가 관건이다.
  • 2500개의 핸들링 가능한 데이터로 정확도를 높였더니 정확도가 99퍼센트였다. (암인지 아닌지 맞추고, 어떤 암인지 맞춤)
  • 이 암이면 앞으로는 어떻게 약물 처방, 진료하는지 예측하는 부분까지 서비스 할 예정


빅데이터를 통한 맞춤, 예측, 예방

  • 5P 의학 시대
  • 유전체를 통한 질병 예측은 가능한가?
  • 질병예측 서비스, 헬로진
  • 아시아 최초로 개인유전체 분석을 통한 질병위험도예측 서비스를 실시했다.
  • 빅데이터 기반의 질병 예측 서비스, 모바일 애플리케이션 구현의 방향으로 간다.
  • 빅데이터 기반 맞춤 다이어트, 약물 추천
  • 사용자 참여형 빅데이터 기반 건강 위험도 예측 및 관리 서비스 개발



건강보험공단 빅데이터를 이용한 한국인 질병 네트워크 구축

Network Science

  • 야당/여당 네트워크, 비자금 조성/로비 구조, 미국 Jefferson 고등학교의 성관계 양, 한국 100대 부호의 혼인관계
  • 사회의 모든 현상들이 네트워크이다.

  • Network in biology
    • 프로틴과의 interaction -> pathway -> network
    • Interaction 많이 하는 hub들이 존재하더라
    • 80/20 rule
  • PPI is scale-free
  • Centrality & Lethality rule
  • Hubs evolve slowly


Disease Network

  • 어떤 질병 걸린 사람들이 어떤 질병 잘 걸리는지
  • Shared gene을 중심으로 질병 간 네트워크 연구했더니 유방암과 전립선 암이 연결되어 있다는 결과가 나왔다. 임상적으로 맞지 않음
  • Symptom을 중심으로 질병 간 네트워크 연구
  • 기간 내 공통된 질병 가진 사람들 위주로 질병 간 네트워크 연구
  • 유전체로 설명 가능한 질환은 20~30퍼센트 정도로 알려져 있다.
  • 유전자 기반의 질병이 성별, 연령이 고려되지 않았다.
  • 건강보험공단 데이터를 기반으로 통계적 이슈로 네트워크 구축



의료정보 이동시 블록체인의 적용 : 실증연구 소개

Q1. A병원에서 검사를 했는데, B병원으로 수술을 받고자 하면 수술 전 검사는 다시 해야 한다. Q2. 환자의 건강정보를 의사가 기록해서 병원 EMR 서버에 저장되어 있는데, 환자의 건강정보의 소유권은 누구의 것인가?

  • 현 상황: 현재 환자 건강정보는 의료기관에 산재되어 있다. (의료 정보 파편화) 일부 불필요한 중복 검사 시행 (병원간 의료 정보 공유 불가능)
  • 의료 데이터가 모두 통합되어 플랫폼에 저장되고 모바일로 개인이 관리할 수 있게 될 것이다.

  • 블록체인이란
    • 분산형 데이터베이스를 바탕으로 데이터를 저장하는 연결 구조체 리스트
    • 여러 참여자(peer)네트워크를 통해 서로의 데이터를 검증하고 저장함
    • 다른 특정인의 데이터 조작을 어렵게 설계한 보안 강화 저장 플랫폼



[후기]

  • 개인정보보호법 때문에 의료데이터는 건드리기가 어렵다고 하는데, 그냥 병원 들어가서 하면 된다. 그리고 표준화 작업을 열심히 하고 있는데, 언제쯤 자리잡을지 궁금하다.
  • 개인 맞춤형 의료 서비스가 나오고 있는데 모두에게 적용될 날이 정말 올까…?
  • heterozygous mutation이 흥미로웠다. homozygous gene보다 기능이 떨어지니 micro molecules이 체내에 축적되고, 이들이 문제를 일으킬 수 있다고 한다. 발표 하나 들을 때마다 유전자 검사를 해보고 싶다는 생각이 강력하게 들었다. 이걸 노린건가…? ㅋㅋ