AI 및 자동화의 급속한 발전은 데이터 분석 및 시각화의 환경을 변화시켰습니다. 빅 데이터와 머신 러닝의 시대에 데이터 과학 분야에서 전례 없는 기능을 제공하는 다양한 형식의 도구가 등장하고 있는데요. 생성형 AI 기술 경쟁이 글로벌 빅테크 지도까지 바꾸고 있습니다. 고성안 교수(UNIST 인공지능대학)는 딥러닝, AI+시각분석/시각화, 인간-AI 상호작용 등을 연구하고 있습니다. 최근에는 인공지능을 활용하여 복잡한 역사 정보를 일목요연하게 정리해 한눈에 보여주는 시스템과 교통정체 예측 인공지능 기술을 개발하고 있습니다.
연구에 대한 자세한 이야기해보도록 하겠습니다.
1. 현재 교수님께서 하고 계시는 주요 연구에 대한 간단한 소개 부탁드립니다.
우리 연구실은 Human-AI Interaction 주제로 다양한 연구를 진행중이고, 특히, 사람들이 하는 수행하는 업무에 AI가 다양한 역할로 참여하여 사람과 AI가 효과적으로 협업하는 기술에 대해 주로 연구하고 있습니다. 구체적으로는, 다양한 도메인/업무 위한 딥러닝 모델 연구, AI 예측 결과를 설명/전달하기 위한 AI 시각화 시스템 연구, 그리고 AI 기술이 도입됐을 때의 생산성 및 행동 변화를 관찰, 분석, 예측하는 AI-HCI (Human-Computer Interaction) 연구, 총 세가지를 주로 메인 연구 주제로 하고 있습니다. 최근에는 거대 언어 모델들이 사람들과의 인터랙션을 위한 주요한 소통 채널 및 협업 파트너로 부각됨에 따라, 거대 언어 모델에 대한 연구도 진행하고 있습니다.
2. 기존의 AI를 활용한 것과 AI 토픽 모델링 기법의 역사 학습 시스템은 무엇이 다른지 궁금합니다.
AI를 활용한 역사 학습 시스템은 다양한 형태로 존재해 왔고, 그 목적은 주로 데이터의 처리와 정보의 제공에 초점을 맞추어 왔습니다. 예를 들어, 사용자는 검색을 수행하고, 시스템이 검색 된 역사적 사실과 날짜를 정리하여 제공하면, 사용자는 제공 된 정보를 검토 하면서 원하는 정보를 취득 하게 됩니다. 그러나 기존 검색 기반의 역사 교육은 검색 할 내용/키워드가 있는 경우에 한해서 학습이 가능하고, 그래서 키워드가 주어지지 않거나, 불명확한 경우, 해당 기술로 역사 공부하기가 어려워집니다. 또한 이러한 역사 공부 방법은 교과서 기반 교육의 연장으로 볼 수 있는데, 교과서 중심의 나열된 지식 위주의 공부는 (우리 모두 경험 한 바 있지만), 스스로 공부 하는 자가주도 학습 역량을 키우기에는 적합하지 않습니다.
이러한 문제를 해결하기 위해서 역사 및 교육 분야 교수님과 함께 논의하여, 역사 지식을 나열식으로, 수동적으로 학습하는 방법 대신, 자가 주도 학습이 가능한 다른 접근 방법을 가능케 하는 HisVA 시스템을 개발 했습니다. 해당 시스템은 AI 기반 토픽 모델링 기법으로 방대한 역사 데이터를 학습하여 다양한 토픽을 제시하고, 사용자는 관심 가는 토픽을 직접 선택하여 역사 내용을 공부 할수 있도록 합니다. 개발된 시스템에서는 대표적인 토픽 모델링 기법인 LDA(Latent Dirichlet Allocation)를 활용했는데, 이 기술은 방대한 양의 문서에서 토픽을 확률 기반으로 추출하고 해당 토픽과 연관된 키워드를 함께 추출합니다. 기존 시스템과의 중요한 차이점 중 한가지로, HisVA는 시간-공간 정보, 위키피디아 연관 정보 검색을 AI 토픽 모델링 기법과 결합함으로써, 사용자가 역사적 사건들 사이의 복잡한 관계를 탐색하고, 시간과 공간에 따른 사건의 흐름을 특정 역사 이벤트들과 함께 이해할 수 있게 해 줍니다. 이 과정은 단순히 키워드를 해석하는 것을 넘어서, 사용자가 직접 시각적 데이터를 통해 역사적 맥락을 파악하고, 복잡한 역사적 관계를 더 직관적으로 이해할 수 있도록 도와줍니다.
3. 자동 추천기능에 대한 자세히 설명 부탁드립니다.
HisVA 시스템에서는 방대한 정보 안에서 사용자 취향에 맞는 토픽을 학습 하는 것을 돕기 위하여 다양한 방식으로 학습 대상을 추천합니다. 예를 들어 위키피디아는 문서들이 다양한 연관 문서를 가지고 있는데, HisVA 에서는, 얼마나 많은 위키피디아 사용자들이, 어느 문서를 어떤 순서대로 읽었는지에 대한 정보를 매칭하여 추천합니다. 협업 필터링 기술의 일종으로 우리가 온라인에서 상품 구매시에, 쇼핑몰에서 다른 구매자들이 함께 구매한 제품을 추천 하는 방식과 유사합니다. 또한 역사적 이벤트의 경우, 연관 문서가 매우 많이 존재하는 이벤트들이 존재 하는데 (e.g., World War I and II), HisVA 에서는 중요한 이벤트를 연관 문서의 숫자 기반하여 중요도 점수를 매겨서 사용자에게 어느 문서가 역사적으로 중요한 이벤트에 대해서 설명하고 있는지에 대해서도 알려줍니다.
4. 역사 학습 시스템으로 더욱 깊이 역사에 대해 세계사까지 매칭할 수 있을 것 같습니다. 데이터 오류나 보완해야 할 점은 없는 건지 궁금합니다.
본 시스템은 위키피디아 데이터에 기반하는데, 해당 데이터의 경우 웹 사용자들이 작성을 하기에 오류들이 종종 존재 합니다. 예를 들어 바다 한가운데 역사적으로 중요한 이벤트가 있다고 표기가 되기도 합니다. 반대로 양질의 방대한 데이터만 확보가 된다면, 훨씬 방대한 역사를 재미있게 탐색 할수도 있습니다. 예를 들어 JSTOR데이터를 시스템의 입력으로 활용할수 있다면 세계사에 있어서 정치, 경제, 사회, 문화 등 사회 전반적인 지식에 대해서 재미있게 공부 할 수 있습니다.
5. 교통 이벤트 발생시의 교통 데이터 분석 및 예측용 시각적 분석 시스템 개발에 대한 자세한 설명 부탁드립니다.
많은 대도시에서 운전자들이 교통정체를 자주 겪고 있지만, 운전자 입장에서는 교통 정체를 만나더라도 네비게이션 업체에서 안내 하는 길을 따라 가는 것 외에는 뾰족한 방법은 없는 상황입니다. 다른 길로 우회하더라도 현재 도로에서 정체가 풀리기를 기다리는 것 보다 낫다는 보장이 없기 때문이지요. 교통 정체 분석, 모니터링, 예측 시스템은, 이러한 상황에서, 만일 개인이 미래 15분, 30분 이내의 교통 상황에 대해서 정보를 가지고 있다면, 정체 도로를 우회하는데 도움이 될것이다라는 생각으로 개발한 시스템입니다. 또한 교통 유관 기관 (울산 교통관리센터, TBN 울산 교통 방송국, 경찰청) 전문가 분들도 활용하여, 신호 체계 개편 등 교통 정체 완화를 위한 정책 개발에 활용할수 있을 것이다라는 생각도 했습니다.
수요 기술에 대하여 구체화 하기 위하여, 교통 유관기관 (울산 교통관리센터, TBN 울산 교통 방송국, 경찰청) 전문가들을 만나서 어떻게 교통 정체에 대응하는지에 대해서 인터뷰를 수행하여, 교통 전문가분들이 업무 수행함에 있어 어려운점을 확인 했고, 이를 바탕으로 교통 정체 예측 하는 인공 지능 기술 탑재한 시각화 시스템을 개발하였습니다. 개발된 시스템은 최종, 웹으로 울산 교통 방송국의 전문가들에게 배포되어, 방송국에서 주기적으로 인공지능이 예측한 15분 후의 교통 상황을 방송 하기도 했습니다.
해당 시스템은 데이터 수집 및 모델 학습, 그리고 시각화를 통한 분석의 총 3가지 단계로 이루어져있습니다. 우선, 본 시스템은 특정 지역 (예) 울산)의 CCTV, 교통량, 속도 정보 등 과거 데이터를 수집하고, 인공지능 모델 및 다양한 통계적 방법론에 맞는 형태로 가공합니다. 이후, LSTM 구조를 활용한 인공지능 모델을 학습시키고, 교통 이벤트로 인한 정체에 대한 패턴 추출을 진행합니다. 최종적으로, 학습된 모델과 수집된 패턴을 다양한 시각화를 통해 사용자에게 제공하여 사용자가 교통 데이터에 대한 더 나은 이해를 할 수 있도록 돕습니다. 이를 통해 이전 발견했던 교통정체의 원인을 더욱 빠르게 파악할 수 있으며, 교통정체에 대한 선제적인 대응을 가능케 할 것으로 기대하고 있습니다.
6. 디지털표현형 기반 정신건강 서비스 및 모니터링 시각화 인터페이스 개발에 대한 자세한 설명 부탁드립니다.
이 연구는 디지털 표현형의 표준화 및 표준화된 지표를 활용한 가능성과 효율성을 과학적으로 검증하며, 이를 지속 가능하게 사용할 수 있는 사용자 및 전문의용 플랫폼을 개발하는 것을 목표로 합니다. 우리 연구팀은 정신의학 전문의와 함께 팀을 이루어, 전문적인 정신건강 검진도구를 활용해 우울, 불안, 스트레스 등의 척도를 주간 단위로 수집하는 모바일 애플리케이션을 개발했고, 또한 사용자의 스마트폰과 스마트워치에서 심박수, 걸음수, 주변 조도, 활동 기록, 앱 사용 이력 등 다양한 디지털 표현형을 실시간으로 수집하여 서버로 전송합니다.
수집된 데이터를 기반으로 참가자의 정신 건강 상태와 활동 패턴을 추적하고 분석할 수 있는 웹페이지도 개발하여 피험자 데이터를 종합적으로 관리하고, 연구자들이 데이터를 더욱 쉽게 분석하고 활용할 수 있도록 지원합니다.
이를 통해 개인의 정신 건강 상태 변화를 시간에 따라 추적하고, 유사한 사용자들을 그룹화하여 그룹 내에서 나타나는 정신건강 패턴이나 특성을 식별하는 기술을 개발하는 하고자합니다. 이 연구는 정신건강 상태를 모니터링하고 분석하는 새로운 방법론과 플랫폼을 제시하고, 수집된 정보는 정신의학 전문의에게 제공되어 보다 효과적인 진료를 받도록 하는 부분에 활용 될 예정입니다.
7. 탄소배출과 이동수요의 예측 및 동시 최적화에 기반한 실시간 교통경로 생성 기술에 대한 자세한 설명 부탁드립니다.
최근 탄소 배출 문제가 이슈로 대두되고 있는데, 우리 연구실에서는, 어느 목적지를 가기 위서 개별 택시를 타는 것보다, 목적지가 근처에 있는 여러 승객이 함께 차량을 탑승하는 방식으로 하여, 탄소 배출량을 유의미하게 줄일수 있다고 생각하고 해당 연구를 시작했습니다. 궁극적으로는 버스 등의 대중교통 탑승률이 높아지면 탄소 배출 측면에서는 더 좋은데, 버스는 노선이 지정되어 원하는 목적지에 바로 도착이 안되고, 이용객이 많을때는 편하게 이동하지 못하는 문제가 있습니다.
그래서 버스와 택시의 중간 형태의 Mobility-On-Demand라고 부르는 공유 운송 서비스 및 플랫폼이 개발 되었습니다. 우리 연구실에서는 이동수요의 예측을 통해 수요에 가장 잘 대응할 수 있는 교통 경로를 만들어 탑승률을 높이는 방안을 통하여, 탄소배출량을 감축 하는 기술 목표 연구 수행중입니다. 이를 위하여 우리는 국외 데이터인 맨하탄 택시 데이터를 활용하여 주중에 어떠한 수요 패턴이 있는지를 먼저 분석하고, 이를 기반으로 다양한 수요에 효율적으로 대처할 수 있는 가상졍류소 (Virtual Station)을 생성했습니다. 가상정류소는 특정 범위 내의 수요를 대표할 수 있는 일종의 정류장으로, 수요에 대응하여 적절한 가상정류소를 정하는 것으로서 불필요한 차량 할당과 동선 낭비를 줄이는 효과를 냅니다. 해당 알고리즘은 MOD 서비스 제공 업체와 함께 실증을 통하여 검증할 예정입니다.
8. 정말 AI가 인간을 초월하는 특이점이 올까요?
최근 AI기술 발전 양상을 고려해 볼 때, 오는 것은 확실하고, 심지어 곧 올 것이라다는 생각이 들고, 오히려 해당 시기가 왔을 때 발생할 문제점들을 고민하고, 그에 대한 대응방안을 적극적으로 고민 해야할 시점으로 생각합니다. 예를 들어 직원채용 평가, 재판 판결등에 AI 활용 될 때, AI가 공정하지 않을 수 있다는 사례가 널리 알려져서, AI공정성에 관한 많은 연구가 시작 된 것과 유사하지요. 이제는 좀 더 사회적인 고민도 시작해야 할 시점입니다. 한 예로, AI가 인간을 초월하면, 인간이 하는 일을 대체하게 될텐데, 그 때 사람들은 뭘 해야 하고 어떻게 해야 모두가 행복할수 있을것인가라는 고민 등이 있겠네요.
9. 요즘 핫한 챗GPT는 어디까지 발전 가능하며 우리 삶에 어떻게 변화시킬지 교수님의 견해를 듣고 싶습니다. 초거대 AI시대가 올까요?
최근 ChatGPT등을 포함한, 멀티모달 거대 언어 모델 기술 개발 동향을 고려할 때, 앞으로 모든 사람이 개인화된 비서와 함께 살게 될것이라고 생각 할수 있겠네요. 아이언맨 영화의 쟈비스처럼, 일정 챙겨 주는 개인 비서 역할에서부터, 많은 부분에 있어, 필요 하다면 로봇을 제어해서 물리적인 일까지 모두 해주는 친구/동료가 생기는 거지요.
10. 연구 진행 중 어려운 점이 있었다면 어떤 점이었으며, 어떻게 해결해 오셨는지 알려주세요.
AI연구는 GPU 장비가 많이 필요 한데, 보통 넉넉하지 않아서 리소스 문제가 종종 발생 합니다. 그래서 최근에는 AI연구에 있어서는 학교가 아닌 회사에서 많이 주도하는 편입니다. 그럼에도 불구하고, 학교에서도 할 수 있는, 그리고 다양한 분야의 연구자들과의 자유로운 협업을 통해서, 새로운/재미있는 연구주제를 찾고 연구하는 방향으로 연구 진행 중입니다.
11. 연구에 대한 국내 상황과 국외 상황을 구체적으로 비교해주신다면 어떤 실정인가요.
요즘에는, 연구 환경에 있어서는 별 차이 없다고 생각하고, 오히려 국내 연구 환경이, 특히 과기원에서의 연구 환경은, 국외 우수한 대학의 연구 환경과 유사하거나 낫다고 생각합니다.
12. AI 시각화 기술이 발전하면서 많은 부분 상용화가 되어 있을 것 같습니다. 국내 기업과 해외 기업에서 가장 눈 여겨 보이는 참 잘 적용했다고 생각하는 기업이 있는지 궁금합니다.
Human-AI interaction 분야는 연구 기술이 상용화가 많이 되는 편입니다. 그래서 학회에서 본 기술이 곧 제품으로 나오는 사례가 많지요. 생산성 측면에서 볼 때, 워드, 엑셀 등의 사무용 제품에 AI 기술 도입한 마이크로소프트 코파일럿 기술을 성공적인 사례로 꼽을 수 있겠네요. 국내에서는 삼성전자 휴대폰, LG전자 가전, 네이버 등이 적극적으로 AI기술을 잘 적용해서 다양한 분야에서 사용자들을 보다 편하게 도와 주고 있다고 생각합니다.
13. 이런 연구에 힘입어 앞으로 연구 계획 중인 연구나 또 다른 목표가 있으신지 궁금합니다.
다양한 분야에서 사람들을 도와주는 AI 기술 개발을 많이 하고자 합니다. 보다 많은 사람들에게 도움을 줄수 있는 연구 방향으로 많이 고민 중인데, 최근에는 헬스케어 분야에서 다양하게 선제적 치료를 도와 주는 기술, 교통 등의 공공 부문의 생산성 향상을 위한 기술, 개인정보 유출 관련 AI기술 방향으로 연구 계획 중입니다.
14. 앞으로 관련 분야를 공부하는 후학(대학원생들)에게 이 분야의 연구에 대한 비전을 제시해 주신다면.
Human-AI 인터랙션 연구는 사람 중심의 연구 방법론으로, 사람들이 불편해 하는점, 어려워하는 부분을 찾아서 해결해 주는 분야입니다. 모두가 만족하는 기술은 없고, 또 예전에는 구현 하기 어려웠던 기술이 AI기술 발전으로 인해서, Human-AI 인터랙션/소통/협업 연구 주제로 새로 개발 가능해 지기도 합니다. 사람에 대한 관심이 있다면, 평생 재미있게 연구 할 수 있는 분야이고, 창업에 도전하기에도 좋은 분야입니다.
|