기계·로봇 연구정보센터

5084

임상 검진의 신뢰도 향상을 위한 기계 및 인공지능 기술의 활용

박정호 (한국과학기술원 기계기술연구소)

이번 연구동향 분석에서는 재활의학 임상 현장에서 환자의 상태를 파악하기 위하여 빈번히 이루어지는 검진의 신뢰도 향상을 위해 연구되어온 기계 및 인공지능 기술 사례에 대하여 소개하고자 합니다. 재활 임상에서 검진은 효과적인 재활 치료를 제공하는데 있어 중요합니다. 우선, 환자의 상태(겪고 있는 장애의 유형 및 심각한 정도)를 정확히 알면 효과적인 치료 방법을 결정할 수 있고, 치료에 따라 장애가 개선된 정도를 정확히 파악함으로써 앞으로의 치료 방법을 조정할 수 있습니다.

하지만,적은 수의 전문가가 제한된 시간내에 여러 환자를 치료해야 하는 의료 현장의 특성상, 검진 결과의 정확도와 신뢰성 못지않게, 쉽고 빠른 방법으로 검진을 할 수 있는 점 또한 중요합니다. 임상 현장에서는 여러 검진 상황에서 정량적 측정 대신에 재활 전문가의 감각과 경험에 의존하여 빠르고 간편하게 측정할 수 있는 검진 방법들이 널리 사용되어 왔습니다. 다양한 장애 증상의 특성에 대한 이해가 높아지고 로봇, 센서 및 데이터 분석 기술이 발전함에 따라 임상 검진 방법에 기술을 접목하여 임상 검진의 신뢰도를 높이려는 연구가 꾸준히 수행되고 있습니다. 경직(Spasticity)의 검진을 예시로 연구 사례들을 살펴보도록 하겠습니다.

경직은 뇌졸중, 외상성 뇌손상, 척수 손상 등 다양한 신경계 질환 후 나타나는 흔한 합병증 중 하나입니다. 뇌졸중 후 편마비(hemiparesis; 뇌졸중으로 손상된 뇌 반구가 운동을 관장하는 팔과 다리의 운동 기능이 약화되는 현상) 또는 척수 손상을 겪은 환자의 최대 70%가 경직을 경험합니다. 경직은 근육이 외력에 의해 길이가 늘어날(스트레칭 될) 때 나타나는 과도한 신장반사(stretch reflex; 근육이 외력에 의해 늘어날 때, 일정한 길이를 유지하기 위해서 수축하는 척수 수준의 반사 현상)로 정의합니다 [1]. 근육의 길이를 얼마나 빠르게 늘리는지에 따라 경직이 더 일찍 발생한다고 알려져 있습니다. 경직은 일상적인 움직임 중 동작을 허용하기 위해 길이가 늘어나야 할 근육이 수축함으로써 일상생활에 필요한 움직임을 저해할 수 있습니다. 경직은 근육의 길이 변화에 대한 저항과 동시에 근육 자체를 뻣뻣하게 만들기도 합니다.

재활 임상현장에서는 경직이 강하게 나타나는 정도를 신경계가 손상된 정도나 재활치료에 의해 신경계의 기능이 회복된 정도를 가늠하는 지표로도 활용하기 때문에, 경직에 대한 평가를 자주 시행합니다. 신장 반사에 의한 급격한 근육 수축은 근전도 신호를 통해 측정할 수 있으며, 근육 수축에 의한 관절의 저항과 움직임 감소의 관점에서도 경직을 측정할 수 있습니다. 그 중 임상에서 널리 사용되는 3가지 평가 방법은 관절의 저항과 움직임 감소의 평가를 바탕으로 하고 있습니다. 하나씩 간단히 살펴보도록 하겠습니다.

MAS는 평가 방법이 간단하여 가장 빠르게 경직을 평가할 수 있지만, 평가자마다 다른 스트레칭 속도에서 평가를 진행할 수 있고, 주관적인 느낌에 의존하기 때문에 평가자간 신뢰도가 낮아질 수 있습니다. MTS는 MAS에 비해 두가지 스트레칭 속도에서 경직이 발생하는 관절 각도를 측정하고, 경련의 지속시간 등 정량적 측정 요소를 포함하지만, 등급 분류는 여전히 검진자의 주관적 느낌에 의존하고 있습니다. 진자 평가는 경직이 있는 관절의 움직임을 정량적으로 측정하지만, 무릎 관절에 대해서만 제한적으로 사용됩니다.

경직 검진의 신뢰성을 높이기 위한 연구는 2000년대 초반부터 꾸준히 이루어지고 있습니다. 경직 검진의 신뢰성이 낮아지는 원인을 경직 반응의 주관적인 느낌에 의존하여 등급을 부여한다는 점으로 보아, 경직 세기를 정량적으로 나타낼 수 있는 지표를 측정하는 방식으로 주관적 등급 분류 방식의 경직 평가를 대체하려는 연구들이 주로 수행되었습니다. 경직 반응의 특징을 표현하는 정량적 지표를 제안하고, MAS 또는 MTS와 같은 임상 척도에 의한 평가 결과와의 연관성(correlation)을 평가하여 제안한 지표의 타당성을 확인했습니다. 또한, 경직 반응이 스트레칭 속도에 영향을 받기 때문에, 일정한 스트레칭 속도를 유지하며 경직 반응을 일관되게 측정할 수 있도록 기계기술이 접목되기도 합니다.

2000년 Pisano 등([5])과 2011년 Ardabili 등([6])은 각각 손목과 팔꿈치 관절의 경직을 평가하기 위하여 관절을 일정한 속도로 움직일 때 발생하는 저항을 측정하는 등속성 동력계(Isokinetic Dynamometer) 방식의 경직 평가 시스템을 개발하였습니다. 두 연구팀의 경직 측정 장치는 기계적으로 유사한 구조를 가지고 있지만, Pisano 등의 측정 장치는 신장 반사가 발생하는 시점을 전기생리학적으로 측정하기 위하여 요측 수근굴근(Flexor Carpi Radialis, 손목을 굽히는 근육 중의 하나)의 근전도를 수집하였습니다.

Pisano 등은 근전도와 저항 측정을 바탕으로 5가지의 정량적 지표를 제안하였고, Ardabili 등은 팔굼치를 펴고 굽히는 사이클에 대하여 팔꿈치 관절 각도에 따른 측정된 토크를 그려, 일종의 hysteresis 곡선을 얻은 뒤 6가지 정량적 지표를 제안하였습니다.

Pisano 등은 총 53명의 다양한 경직 세기를 보이는 뇌졸중 환자를 대상으로 재활 전문가가 매긴 Ashworth 등급과의 연관성을 평가하였고 느린 속도(10deg/s)에서의 관절 강성을 제외한 1~4번 지표 모두 (절대값 기준) 0.36~0.55 사이의 연관계수를 가져, 중간(moderate) 등급의 연관성이 있음을 보고하였습니다 [5]. Ardabili 등의 연구에서는 총 15명의 경직 환자를 대상으로 위 6개 지표와 재활 전문가가 평가한 MAS 등급을 비교하였을 때, 6개 지표 중 굴곡 운동과 신전 운동 중의 전체일(FTW, ETW)가 전문가가 매긴 MAS 등급과 0.72~0.89의 연관계수(correlation coefficient)를 보여, 강한(strong) 연관성을 보였습니다 [6].

2013년 Bar-On 등은 무릎 및 발목 관절의 경직을 평가하기 위하여 환자의 신체에 부착할 수 있도록 로드셀, 관성센서(IMU) 및 근전도 센서로 구성된 착용형 측정 장치를 개발하였습니다 [7]. MAS 평가 방법과 동일하게 피험자가 환자의 관절을 펴면서 근육을 스트레칭할 때, 관절의 각도, 검진자가 가하는 힘, 경직 평가 대상 근육의 근전도 신호를 수집하였습니다.

무릎 관절에서는 근전도 RMS가 0.64의 연관계수를 가져 높은(Good) 연관성을 보였고, 기계적 일과 토크 관련 지표는 0.44~0.59의 연관계수를 가져 중간(moderate) 수준의 연관성을 보였습니다. 발목 관절의 경우는 세 지표 모두 연관계수가 0.46~0.49로 역시 중간 수준의 연관성을 보였습니다.

4명의 피험자 데이터로부터 각 MAS 등급에 대하여 4가지 지표의 기준값을 선택하였습니다. 피험자의 수가 적어 연관성 분석을 수행하지 않은 대신, MAS 등급 별 지표값을 바탕으로 사람의 팔꿈치 관절을 모사한 햅틱 시뮬레이터에 경직 반응을 구현하고, 재활 전문가에게 MAS 등급 평가를 의뢰한 결과 연구에서 다룬 4개 MAS 등급에서 75~100%의 일치도를 나타냈습니다.

2018년 최서영 등은 관성센서를 이용하여 MTS를 이용한 경직 평가 중 관절 각도 변화를 측정하는 시스템을 개발하였습니다 [9]. 관절 각도에 대한 정량적인 측정값을 제공하는 것을 넘어, 관절 각도 데이터를 이용하여 기존의 MTS 등급 분류 과정을 자동화하는 알고리즘을 제안하였습니다. 또한, 검진자가 환자의 관절을 스트레칭하는 속도를 일정하게 유지할 수 있도록, 시각적 피드백을 제공하였습니다.

재활 전문가 사이의 MTS 평가 결과의 신뢰도가 0.2~0.6 수준인데 반하여, 제안한 관성센서 기반 MTS 평가 시스템은 2명의 재활 전문가와 0.8 이상의 높은 평가자간 신뢰도를 나타내었습니다. 최서영 등의 연구는 선행 연구에 비하여, 기존 임상 검진 방법을 최대한 보존하면서, 정량적인 측정 도구의 활용을 통해 객관성을 강화하였습니다. 선행 연구를 통해 개발된 경직 평가를 위한 등속성 동력계, 착용형 장치들이 임상 현장에서 사용되지 않은 것에 비하여, 최서영 등의 연구는 기존 임상 검진 방법과의 호환성을 유지하여, 향후 임상 현장에서 활용될 가능성이 높다고 생각합니다.

기계학습이 대중화되며 다양한 분야의 연구에 활발히 활용되고 있는 요즘, 임상 검진에 대해서도 기계학습을 접목하려는 시도들이 활발히 보고되고 있습니다. 기계학습은 두 요소 간의 대응관계를 명확히 표현할 수 없을 때, 많은 양의 데이터를 기반으로 두 요소 간의 대응관계를 근사하는 방법입니다. 검진 방법이 매우 간소화되어 많은 불확실성이 내재되어 있는 임상 검진 또한 기계학습 방법론을 적용하여 정량화하기 좋은 경우입니다. 다수의 검진자의 분류 결과를 학습한 알고리즘을 임상 검진에 활용하면 검진자에 따라 검진결과가 달리지지 않고, 일정한 결과를 얻을 수 있을 것입니다. 기존 임상 검진 중 수집된 데이터가 아니라 넘어, 일상적인 운동 데이터로부터 임상 검진 결과를 예측하려는 연구들도 기계학습 방법론을 활용하기에 가능한 시도라고 볼 수 있습니다.

2019년 박정호 등은 MAS 검진 중 수집한 관절 각도와 저항 데이터를 5개 MAS 등급으로 분류하는 기계학습 알고리즘을 개발하고, 학습된 분류 기준을 해석하여 경직 반응의 어떤 특징들을 바탕으로 MAS 등급이 결정되는지 설명하였습니다 [10]. 경직의 정량적 지표를 제안한 선행 연구를 바탕으로 8개 지표를 선정하고, 새로운 1개 지표를 제안하여, 총 9개의 정량적 지표의 값을 MAS 검진 데이터로부터 추출하였습니다. 3층 구조의 Perceptron 알고리즘을 이용해 MAS 등급을 분류하였습니다. 총 28명의 재활 전문가(재활의사 및 물리/직업치료사)가 34명의 경직 환자를 평가하면서 수집한 648회의 MAS 검진 샘플을 기계학습에 활용하였습니다. 여러 검진자가 (각기 다른 기준으로) 결정한 MAS 등급과 최대한 높은 일치도를 얻도록 학습이 진행되었으며, 학습 후 약 82%의 일치도를 보였습니다.

9개의 경직 지표 중 어떤 특징이 MAS 등급 분류에 중요하게 사용되었는지 해석하기 위하여 Bach 등이 개발한 Layer-wise Relevance Propagation(LRP) 알고리즘[11]을 활용하였습니다. LRP 알고리즘의 핵심 아이디어는 두 레이어 사이에서 다음 레이어의 한 노드의 결과값에 대한 이전 레이어의 각 노드들의 기여도에 따라 점수를 배분하는 것입니다. 각 샘플에 대해 결정된 MAS 등급에 해당하는 노드의 출력값을 이전 레이어로 분배하며, 최종적으로 어떤 입력 변수가 MAS 등급 결정에 중요하게 기여했는지 추정합니다. 박정호 등은 각 MAS등급을 결정하는데 다른 3~4개 가량의 지표가 중요하게 사용된다는 점을 발견하였고, 기존의 MAS 평가 방법 상의 MAS 등급의 정의와 비교하여 일치하는 부분과 일치하지 않는 부분을 토의하였습니다.

2023년 Yee 등은 재활 전문가가 팔꿈치 경직 환자의 MAS 검진을 하는 동안, 팔꿈치 관절 각도, 검진자가 느끼는 저항, 팔꿈치 굴곡근의 근전도를 측정하였습니다 [12]. 관절각도, 저항, 근전도로부터 각각 8개, 6개, 4개의 지표를 추출하였습니다. 재활 전문가들의 MAS 평가 노하우(Logic)와 지표 값에 대한 Support Vector Machine 및 Random Forest 알고리즘 기반 등급 분류를 결합한 Logical-SVM-RF 분류기를 제안하였습니다.

50명의 경직 환자로부터 270여회의 평가 데이터를 이용해 MAS 등급을 분류하도록 학습하였습니다. 많은 기계학습 연구에서 활용되는 Support Vector Machine, Decision Tree, Random Forest 등의 방법을 단독으로 활용하는 알고리즘과 비교하여, Yee 등이 제안한 Logical-SVM-RF 알고리즘이 더 높은 성능 (기존 알고리즘 단독 사용: 0.56~0.81 vs Logical-SVM-RF: 0.91)를 나타냈습니다.

2021년 Chen 등은 피험자가 스스로 팔꿈치를 굽혔다 펴는 자발적 운동(voluntary movement)중 수집된 상지 동작 및 근전도 데이터로부터 MAS 등급을 예측하는 기계학습 알고리즘을 개발하였습니다 [13]. 13명의 피험자는 팔꿈치 관절을 중심으로 배치된 원형 레일을 따라 움직이는 손잡이를 잡고 팔꿈치를 가능한 빠르게 폈습니다. 운동 중 팔꿈치를 굽히는 근육 2종(이두박근, 상완요골근)과 팔꿈치를 펴는 근육 1종(삼두박근)의 근전도를 수집하였습니다. 연구자들은 동작 및 근전도 신호의 특징값을 추출한 뒤, 추출한 특징값으로부터 MAS 등급을 분류하도록 학습한 결과, F1-score 기준 약 0.95로 높은 분류 성능을 보였습니다. Perceptron, Support Vector Machine 등 다양한 분류 알고리즘 중 Random Forest 알고리즘이 가장 높은 성능을 보였습니다. 기존의 임상 검진 방법처럼 검진자에 의한 스트레칭을 하지 않고, 환자 개인의 자발적 움직임으로부터 MAS 등급을 분류할 수 있었기 때문에, 향후 wearable 기기를 통해 동작 및 근전도를 측정할 수 있도록 개선된다면 병원 방문 필요없는 간편한 경직 평가를 구현하는데 활용될 수 있을 것이라 보입니다.

2022년 LEE 등도 경직 환자의 자발적 운동 데이터로부터 상지의 팔꿈치, 손목, 엄지 및 기타 손가락의 경직을 자동으로 평가할 수 있는 기계학습 기반 알고리즘을 개발하였습니다 [14]. 운동을 측정하기 위하여 19개의 관성센서로 구성된 착용형 장치와 손을 쥐는 운동을 측정할 수 있는 압력 측정 공이 함께 개발되었습니다. 위 장치들을 활용하여 상지의 움직임과 손의 힘 데이터를 총 4개 동작(고깔 쌓기, 빠르게 굽혔다 펴기, 공을 지긋이 쥐기, 공을 빠르게 쥐기)에 대해 상지 관절의 각도와 손의 쥐는 힘을 측정하였습니다. 측정한 데이터로부터 추출된 특징값을 MAS 등급으로 분류하도록 학습하였습니다. 팔꿈치와 (엄지가 아닌 기타) 손가락의 경직을 측정하는데 고깔 쌓기 운동의 데이터를 이용할 때 가장 높은 정확도를 달성할 수 있었고 (F1-score 기준, 팔꿈치: 0.95, 엄지: 0.90), 손목과 엄지의 경우에는 빠르게 공을 쥐는 운동의 데이터를 활용할 때 가장 정확히 분류할 수 있었습니다 (F1-score 기준, 손목: 0.92, 엄지: 0.95). 네 상지 관절의 경직을 평가할 때 한 운동만 사용 가능하다면, 빠르게 공을 쥐는 운동의 데이터를 활용하는 것이 평균적으로 가장 높은 분류 정확도를 달성하였습니다. Lee 등은 이 결과를 바탕으로, 자발적 운동 데이터를 이용해 경직을 평가하는 것이 가능하며, 자발적 운동에 대한 경직의 영향에 대한 시사점을 도출할 수 있을 것이라 제안하였습니다.

이번 연구동향 분석에서는 임상 검진의 신뢰도를 향상하기 위해 기계 및 기계학습 기술을 적용한 연구 사례들을 경직 검진의 예시를 통해 살펴보았습니다. 검진자의 주관적인 판단을 대체하기 위하여 경직의 특징에 대한 정량적 지표의 활용을 제안하는 접근법이 있었고, 기존의 임상 검진 방법을 최대한 보존하면서 평가 조건 및 기준을 일관되게 유지하려는 접근법도 있었습니다. 경직 반응을 일정하게 측정하기 위하여 등속성 동력계, 센서 계측값에 대한 피드백을 제공하는 등의 기계 기술이 활용되었습니다. 기계학습은 주로 임상 검진의 평가 기준을 알고리즘으로 구현하여, 향후 일정한 기준으로 반복적인 평가를 하기 위한 목적으로 활용되었습니다. 최근에는 일상적인 운동 데이터로부터 임상 검진 결과를 추론함으로써, 검진의 활용성을 높이려는 시도들도 이루어지고 있습니다. 정확하고 일관된 검진은 효과적인 재활 치료 서비스를 제공하는데 있어 필수적이기 때문에, 앞으로도 임상 검진의 개선을 위한 연구들이 앞으로도 꾸준히 이루어질 것입니다. 더 다양한 임상 검진에 대하여 다양한 기계기술이 접목되어 임상 현장에서 널리 활용될 수 있는 기술들이 개발되길 희망하며, 연구동향 분석을 마치겠습니다.

Flexor Carpi Radialis
Isokinetic Dynamometer
MTS
MAS
stretch reflex

전체댓글 0

[로그인]

댓글 입력란

0/500자