기계·로봇 연구정보센터

4629

기계학습 기반 의료영상분석을 통한 예후 진단연구

박상현 교수(DGIST 로봇공학전공) / shpark13135 at dgist.ac.kr 2021-08-10

최근 인공지능의 발달로 의료영상 및 데이터를 자동으로 분석하여 진단에 도움을 주기 위한 연구들이 나타나고 있습니다. 관련분야 연구의 중요성이 커지고 있지만 각 병원에서 구축한 데이터의 통합과 레이블링 구축이 어려워 연구의 어려운 점이 많습니다.

오늘 인터뷰에서 만나 보실 박상현 교수(DGIST 로봇공학과)는 의료영상분석, 병리영상분석, 의료로봇추적, 생체신호처리 등을 위한 고급 인공지능(AI) 알고리즘을 연구하고 계십니다. 최근 Multiple Instance Learning (MIL) 기법을 이용하여 COVID-19으로 인한 폐렴과 세균성 폐렴을 CT 이미지에서 높은 정확도로 진단하는 기술 개발에 성공하여 의료영상 분야 극상위 국제 학술지인 Medical Image Analysis (IF=11.15, JCR 상위 1.4%)에 게재되었습니다. 로봇 비전과 머신러닝 알고리즘 개발을 통한 헬스 케어 시스템 연구에 대해 중점적으로 이야기해보도록 하겠습니다.

1. 현재 교수님께서 하고 계시는 주요 연구에 대한 간단한 소개 부탁드립니다.

DGIST 로봇공학전공의 의료영상 및 신호처리연구실(Medical Image & Signal Processing Lab)에서는 의료영상분석 (분류, 퀄리티향상, 분할, 정합), 병리영상분석, 의료로봇추적, 생체신호처리 등을 위한 다양한 인공지능 알고리즘을 개발하는 연구를 수행하고 있습니다. 국내 유수의 대학병원 전문의들과 협업해 진단과 병변검출을 위한 소프트웨어를 개발하고 있고, DGIST 로봇공학전공의 여러 교수님들과 의료로봇의 내비게이션, 인간-로봇 인터렉션을 위한 연구들을 진행하고 있습니다.

저희 연구실에 관심이 있으신 분들은 아래 STAR MOOC 강좌를 들어보시면 연구들을 이해하시는데 도움이 될 것입니다.

https://dgist.edwith.org/medical-20200327

2. 최근 Multiple Instance Learning (MIL) 기법을 이용하여 COVID-19으로 인한 세균성폐렴을 CT 이미지에서 높은 정확도로 진단하는 기술 개발에 성공하여 의료영상 분야 극상위 국제 학술지인 Medical Image Analysis (IF=11.15, JCR 상위 1.4%)에 게재되었습니다. 연구하신 알고리즘에 대해 자세한 설명 부탁드립니다.

Multiple Instance Learning (MIL) 은 여러 인스턴스들의 특징들을 묶음으로 입력으로 받았을 때 이들 중 주요한 인스턴스들을 선별해 묶음의 레이블을 정확하게 예측해 줄 수 있는 학습모델입니다. 사이즈가 큰 고해상도 이미지 내부에 작은 병변이 있을 때 영상 전체를 보고 판단을 내리기 보다는 MIL을 이용해 주요한 영역을 선별해 결과를 예측하면 성능을 높일 수 있습니다.

본 연구팀은 2020년 MIL 기술을 병리영상 분석에 활용하여 좋은 결과를 얻어냈고, 이를 발전시켜 본 논문에서는 여러 2차원 slice들로 구성된 3차원 CT 영상 분석에 적합한 알고리즘을 개발했습니다. CT 영상을 활용한 COVID-19 진단에 적합하도록 두 개의 attention pooling 모듈과 비지도학습기반 contrastive learning을 활용했습니다. Attention pooling을 이용하면 인스턴스 별로 다른 가중치를 줄 수 있으며, 일부 slice 혹은 국소 위치에만 존재하는 병변 특징들을 선별하여 결과를 향상시킬 수 있습니다.

또한 최근 활발히 연구되고 있는 비지도학습기반 contrastive learning을 이용하여 환자별 특징 추출 성능을 극대화한 부분도 분류성능 개선에 도움을 주었습니다. 제안하는 기법은 학습을 할 때 병변 레이블링을 만들어주지 않더라도 병변의 위치를 자동으로 찾아낼 수 있는 Weakly supervised learning이라는 점이 또 다른 장점입니다. CT 진단 뿐 아니라 다양한 의료영상 내에서 이상부위를 자동으로 검출해주기 위해 활용할 수 있을 것으로 기대하고 있습니다.

3. 딥러닝 기반 CT영상 복원 및 분석 기술 방법 대해 연구하신 내용 설명 부탁드립니다.

CT 영상은 촬영 시 기기에서 발생하는 방사선으로 인해 환자에게 잠재적으로 피해를 줄 수 있다는 문제가 제기되어 왔습니다. 이를 해결하기 위해 저방사선으로 촬영한 CT 영상을 고방사선으로 촬영한 CT 영상 퀄리티 수준으로 복원해주기 위한 알고리즘이 개발되고 있습니다.

본 연구진도 관련 연구에 관심을 가지고 있으며 저주파-고주파 성분을 따로 고려해 CT 영상을 복원해줄 수 있는 Octave Convolution 기반의 알고리즘을 개발하였습니다. CT 영상에는 영상구조를 나타내는 저주파 성분과 CT 잡음과 같은 고주파 성분이 함께 존재하는데 Octave Convolution을 이용하면 고주파 성분을 제거하는 모델을 학습하는 데에 더 많은 파라미터를 사용할 수 있습니다.

제안한 모델로 잡음을 제거했을 때 기존 Convolution neural network 모델에 비해 +0.3dB 가량 더 높은 PSNR(Peak-to-Signal-Ratio) 성능을 얻었습니다. 올해에는 노이즈 모델을 활용한 자가지도학습 기반의 CT 잡음 제거 기법을 개발했습니다. CT 영상의 잡음은 일반 영상에서 발생하는 Gaussian잡음이나 Poisson잡음처럼 랜덤한 구조를 보이지 않습니다. 본 연구에서는 CT 영상 잡음을 생성하기 위한 Ensemble 기반의 노이즈 모델을 개발하였고 이를 통해 만들어진 저방사선 영상을 고방사선 영상으로 복원해주는 모델을 반복적으로 업데이트함으로써 기존모델들에 대비 0.3~3dB 가량 높은 PSNR 성능을 얻을 수 있었습니다.

4. 연구 중 구강악안면 수술을 위한 인공지능 기반의 증강현실 수술 시스템도 개발하셨는데요. 자세한 설명 부탁드립니다.

구강악안면 수술은 뼈를 절개하고 재접합하는 어려운 수술입니다. 따라서 수술 전 절개 부위 진단과 수술 후 경과분석을 위해서 의학적으로 의미있는 랜드마크들을 찾고 이들을 원하는 위치로 옮기기 위한 수술계획을 세우게 됩니다. 저희는 두개골 표면 위의 랜드마크들을 자동으로 찾아주기 위해 U-Net 기반의 segmentation 모델로 두개골을 영역화한 뒤, convolutional neural network 회귀 기법으로 랜드마크들을 찾아주는 기법을 개발하였습니다.

랜드마크들 사이의 관계를 효과적으로 고려해주기 위해 Active shape model을 활용하여 랜드마크들의 구조가 이상하게 변형되지 않도록 제한해줌으로써 성능을 향상시킬 수 있었습니다. 랜드마크가 추출되면 Mesh 구조로 만들어 놓은 3차원 모델을 랜드마크에 맞추어 위치시킬 수 있고, 증강현실을 통해 모델을 시각화해줄 수 있게 됩니다. 이 시스템을 이용하면 의사들이 수술계획을 수립하는 데에 도움을 줄 수 있을 것으로 기대하고 있습니다.

5. 연속 지역화 된 프레임에서 심층 컨볼 루션 신경망을 사용한 Guidewire 로봇 팁의 실시간 추적에 대한 연구하신 내용 설명 부탁드립니다.

심장 질환을 치료하기 위해 X-ray영상을 확인하며 혈관에 카테터를 넣어 시술을 진행하게 됩니다. 최근 이 시술을 위한 미세하고 가는 가이드와이어 로봇이 개발되고 있습니다. 이런 로봇시스템을 보다 안전하게 이용하기 위해서는 X-ray영상으로 3차원상의 혈관 위치를 유추하여 가이드와이어 로봇의 위치와 포즈를 제어해주는 내비게이션 기술이 필요합니다. 본 연구팀은 내비게이션 요소기술로써 얇으면서도 변화가 심한 가이드와이어의 팁 부분을 정확하게 추적하기 위한 알고리즘을 개발하였습니다.

실시간 추적을 위해 로봇의 위치를 faster RCNN 기반의 검출기법으로 찾아낸 뒤 이후 주변 영역에서 U-Net을 통해 팁 부분을 segmentation 해내는 기법을 제안하였습니다. 또한 로봇을 추적할 때 이전 프레임의 결과를 이용하여 검색범위를 효과적으로 줄여줌으로써 실시간으로 정밀한 추적이 가능하게끔 기법을 개발하였습니다.

6. 의료영상 분석은 어떠한 사항들이 특히 고려되어야 하며, 개발 중 가장 핵심 부분은 어떤 것들이 있을까요?

일반영상 분석과 달리 의료영상 분석에서는 고려해야 할 사항이 많습니다. 먼저 학습모델이 편향되지 않았는지 검증해야 합니다. 연구를 위해 수집한 데이터가 demographic 정보나 (나이, 성별 등) 촬영장비 혹은 장비내부의 파라미터 등에 편향되어 있을 수 있습니다. 데이터셋이 편향된 경우에는 테스트 결과가 병원마다 크게 달라질 수 있으며 임상적으로 유의미한 특징을 활용해 병명을 예측하는 것이 아닌 편향 정보를 활용해 병명을 예측하는 모델이 학습될 수 있습니다.

따라서 편향되지 않은 데이터셋을 구축하도록 여러 병원 및 기관과 협업해야 하고 편향을 완화하기 위한 기법들을 적용해야 할 수도 있습니다. 이와 함께 개발한 모델이 임상적으로 유의미한지 여러 측면에서 검증해야 합니다. 새로운 기법을 개발하여 특정 케이스에 대해 좋은 결과를 얻었더라도 다양한 케이스에 대해 임상적으로도 유의미하지 않다면 의료현장에서 활용될 수 없습니다.

이러한 이유로 임상의와 긴밀하게 협업해서 여러 측면을 검증해야 합니다. 이외에도 건강한 사람의 데이터와 환자 데이터 간 불균형 문제, 레이블링이 어려운 문제, 병원 및 기관별로 독립적으로 연구가 이루어짐에 따라 공정한 비교 및 재현이 어려운 점, 의료데이터에 포함된 개인정보 유출 문제로 인한 데이터 공유의 한계 등 의료영상분석 연구에 있어서 신경을 써야하는 부분들이 많습니다.

7. 우리나라는 각 기관별 방대한 의학 영상 데이터가 구축되어 있으나 각 연계와 공유가 미흡한 실정이라고 하는데요. 의료데이터는 민감한 데이터이므로 분석과정에서 병원과 의사들의 협조가 필요할 것 같습니다. 연구 진행 중 어려운 점이 있었다면 어떤 점이었으며, 어떻게 해결해 오셨는지 알려주세요.

각 기관별로 병을 지칭하는 명칭, EMR 저장되는 형태 (줄글, 숫자, 코드 등), 영상을 획득하는 장비, 촬영 프로토콜, 슬라이드 염색방법 등 다양한 부분에서 차이가 있습니다. 이런 차이를 완화하기 위해 표준화 작업들이 진행되고 있으나 각 병원에서 보유하고 있는 노하우와 임상의가 각기 다른 목적을 가지고 시행한 검사들은 표준화하기가 어렵습니다.

이런 문제들을 해소하기 위해 국가에서 큰 과제들을 기획해서 연구가 진행되고 있습니다. 기술적으로는 기관별 획득한 데이터의 차이를 완화시켜주기 위한 정규화 알고리즘이나 이미지 변환 혹은 생성기법들이 꾸준히 개발되고 있습니다. 유용한 알고리즘을 개발하기 위해서는 다루고자 하는 질병 설정, 환자범위 설정, 데이터 전처리, 데이터 레이블링, 결과검증 등 다양한 부분에서 전문의들의 협조가 필요합니다. 이러한 협조를 위해 충분히 소통을 하며 연구를 진행하고 있습니다.

8. CT 잡음 제거하는 AI 기술이 KIMES 2021(국제의료기기·병원설비전시회)에서 공개되어 이목을 끌었습니다. 환자의 입장서 최소 방사선량으로 최적화된 영상을 제공받을 수 있는 기술인 듯한데요. 교수님의 견해를 듣고 싶습니다.

CT 잡음 제거 기술은 꾸준히 연구되어 왔고 GE, Siemens, Philips 등 주요 의료장비 회사에서도 활발히 연구를 진행하고 있습니다. 주로 필터링 기반 기법들과 Dictionary learning, Sparse learning 등과 같은 머신러닝 기법들이 사용되었었는데 최근에는 저방사선-고방사선 CT 영상 사이의 차이를 딥러닝을 통해 학습하는 기법들이 제안되고 있습니다.

또한 잡음 제거에 효과적인 특징을 스스로 찾아주기 위한 자가지도학습 기법들과 도메인 사이의 차이를 학습하기 위한 비지도학습 기법들도 제안되고 있습니다. 이러한 연구들은 앞으로도 지속적으로 진행될 것으로 생각합니다.

20210809080415%2D%2Ejpg

9. 기계학습을 활용한 인공지능 헬스 케어에 대한 국내 상황과 국외 상황을 구체적으로 비교해주신다면 어떤 실정인가요? 어디까지 발전되고 있는 건지 궁금합니다.

국내외 모두 인공지능을 활용한 헬스케어 산업이 크게 발전하고 있다고 생각합니다. 대표적으로 의사가 의료영상을 판독하기 전에 우선순위를 정하거나 병변의 위치를 미리 표시해주는 pre-screening, 혹은 실수로 정상으로 판독된 의료영상 중에서 놓친 병변일 확률이 있는 곳을 선별하여 재 판독을 요청하는 post-screening 등을 위한 소프트웨어가 출시되고 있습니다.

진단 외에도 속도를 요구하는 작업 (응급실), 병변의 수치화, 심장 혈류 측정 등 진단 외 다양한 방면으로 의사의 진단을 보조하는 인공지능이 출시되고 있고, 병리영상 및 내시경영상 분석에도 인공지능이 활용되고 있습니다. 많은 스타트업 회사들이 생기고 있고 경쟁이 가속화되고 있는 상황으로 국내 기업들이 관련 원천기술들을 선점할 수 있다면 국가경쟁력 향상에 도움이 될 것이라 생각합니다.

10. 이런 연구에 힘입어 앞으로 연구 계획 중인 연구나 또 다른 목표가 있으신지 궁금합니다.

의료 인공지능 기술을 고도화하여 현재까지 해결하지 못하고 있는 문제들을 지속적으로 해결해나갈 계획입니다. 정리가 잘 된 충분한 학습데이터를 모으기 힘든 경우가 많기에 데이터 부족 문제를 해결하기 위한 semi supervised learning 기법이나, 편향을 완화하는 학습 방법, 판단근거를 제시해주기 위한 인공지능 기술을 개발하는 것이 중요하다고 생각합니다. 또한 장기적으로는 사람과 같이 여러 다른 타입의 의료지식을 점진적으로 학습할 수 있는 모델을 만들어 여러 병원에서 두루 활용될 수 있는 플랫폼이 개발된다면 지금보다 활용도가 높아질 것으로 기대하고 있습니다.

11. 앞으로 관련 분야를 공부하는 후학(대학원생들)에게 이 분야의 연구에 대한 비전을 제시해 주신다면.

의료 및 헬스케어 시장은 매년 꾸준히 성장하고 있으며 더 크게 성장할 시장임에는 의심의 여지가 없습니다. 인공지능 기술은 이 시장의 핵심기술이라 생각합니다. 그간 많은 발전을 이루었지만 아직도 해결해야 할 문제들이 많습니다, 여러분들이 개발하고 있는 기술이 미래에 많은 사람의 생명을 살리고 삶의 질을 높여줄 수 있다는 점에서는 연구자로서 큰 보람을 느낄 수 있는 분야라고 생각합니다. 많은 인재들이 의료인공지능에 관심을 가져주시기를 바랍니다.

의료영상처리
생체신호처리
컴퓨터비전
로봇인공지능
머신러닝,딥러닝

의료영상 및 신호처리연구실(Medical Image & Signal Processing Lab)

전체댓글 0

[로그인]

댓글 입력란

0/500자