비식별 데이터를 활용하는 연합학습을 통해 프라이버시를 보호하면서 AI 성능의 이점 살려

[테크월드=이건한 기자] 엔비디아가 미국 시카고에서 열린 연례 방사선 의료기기 전시회 '북미방사선 의학회 2019(RSNA)'에서 '엔비디아 클라라 연합학습(이하 클라라 FL)'을 공개했다. 클라라 FL은 '분산형 협력 학습(Distributed-collaborative learning)'을 통해 환자 데이터를 의료 서비스 공급자가 내부적으로 보관할 수 있도록 하는 시스템이다.

딥러닝 기반의 인공지능은 학습에 투입되는 데이터의 양과 품질에 비례해 성능이 향상되는 특징이 있다. 이는 의료 분야에 적용할 때도 마찬가지다. 병원이 활용할 수 있는 환자 데이터의 규모와 종류가 다양해질수록 그들의 AI는 이를 기반으로 보다 정확한 질병 예측과 진단을 내놓을 수 있게 된다. 혹은 개별 환자에게 더 적합한 치료법을 AI가 추천하는 것도 가능해진다. 

하지만 환자의 병력이 노출될 수 있는 의료 데이터는 가장 민감한 개인정보로 여겨진다. 이 때문에 병원이 환자 개인의 의료 데이터를 임의로 활용하는 부분에 대한 규제는 아직까지 대부분의 국가에서 엄격히 제한하고 있는 편이다. 그런 측면에서 클라라 FL의 기반 기술인 분산형 협력 학습, 즉 '연합학습'은 개인정보 수집에 대한 리스크를 최소화하면서도 AI 고유의 장점을 살릴 수 있는 합리적인 대안으로 연구되고 있다.

연합학습은 먼저 각 데이터를 로컬(디바이스, 서버)에서 수집한 뒤, 해당 데이터에서 개인을 식별할 수 있는 정보를 제거하고 안전한 연결 통로를 통해 클라우드 서버로 전송한다. 서버에서는 비식별 상태로 취합된 이 데이터들을 분석해 문제 해결을 위한 최적의 알고리즘을 생성하고, 이를 다시 로컬 AI에 학습시키는 것이 연합학습의 기본 구조다. 

클라라 FL을 사용하는 각 병원의 엔비디아 EGX 서버 역시 자체 보유한 로컬 데이터에 글로벌 모델을 학습시키는 방식으로 AI의 성능을 개선한다. 또 이렇게 개선된 로컬 데이터는 다시 연합학습을 위한 서버로 공유되며, 연합 평균화 과정을 통해 모델의 성능이 적정한 수준으로 높아질 때까지 공유, 최적화, 학습 과정을 반복한다. 더불어 환자 기록을 제외한 부분적인 모델 가중치를 공유하는 방식으로 개인정보를 보호한다.

현재 미국영상의학회(ACR)은 의료영상용 국가 플랫폼인 AI-LAB에 엔비디아 클라라 FL를 시범 운영하고 있다. AI-LAB은 ACR의 의료영상 회원 3만 8000명이 AI 모델을 안전하게 구축, 공유, 조정, 검증하도록 할 계획이다. 

영국에서는 엔비디아와 킹스 컬리지 런던(King's College London), 의료 분야 전문 머신러닝 기업 오우킨(Owkin)이 협력해 국가보건서비스(NHS)의 연합학습 플랫폼을 구축하고 있다. 엔비디아 클라라에서 운영되는 오우킨 코넥트(Owkin Connect) 플랫폼은 알고리즘이 로컬 데이터 세트를 학습하며, 한 병원에서 다른 병원으로 전송될 수 있도록 지원한다. 

엔비디아는 이 프로젝트가 우선 런던 최고의 의과 대학 부속 병원을 연결해 암, 심장마비, 신경퇴행성 질병 등의 연구를 가속화하는 AI 서비스를 제공한 뒤, 2020년까지 최소 12개의 영국 병원으로 확대될 예정이라고 밝혔다. 

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사