dxlab(지도교수 박은일), CHI 2026, MMsys 2026, WWW 2026에 총 4편 게재 승인
2026-03-16
dxlab (지도교수: 박은일, https://dsl.skku.edu)의 논문이 HCI 분야 최우수 학술대회인 CHI 2026에 1편, 인공지능/멀티미디어 분야 최우수 학술대회인 MMsys 2026에 1편, WWW 2026에 2편 게재 승인되었습니다. 해당 논문은 26년 4월에서 6월에 걸쳐, 바르셀로나와 홍콩, 두바이에서 발표될 예정입니다. 01. (CHI 2026) “Thriving, Not Just Growing: Structural Sustainability as the Key to Quality in Online Wellness Communities” 논문은 박신유 석사과정(인공지능융합학과), 차준엽 박사과정(인공지능융합학과), S. Shyam Sundar 교수가 저자로 참여하였고, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 온라인 웰니스 커뮤니티의 성공을 사용자 수나 활동량과 같은 양적 성장 지표로만 평가해 온 기존 접근의 한계를 지적합니다. 이를 보완하기 위해 연구팀은 커뮤니티의 장기적 품질을 결정하는 메커니즘으로 '구조적 지속가능성(Structural Sustainability)' 프레임워크를 제안했습니다. 해당 프레임워크는 지속적으로 참여하는 안정적인 핵심 사용자 구조(Stable User Structure), 단순한 정보 전달을 넘어선 질적으로 유의미한 상호작용(Meaningful Interaction), 조율된 커뮤니티 정체성(Coordinated Community Identity)이라는 세 축으로 구성됩니다. 연구팀은 2023-2024년 동안 56개의 Reddit 웰니스 커뮤니티에서 수집한 1,700만 건 이상의 게시글 데이터를 분석해 사용자(User), 콘텐츠(Content), 정체성(Identity) 차원에서 커뮤니티 품질을 정량적으로 측정했습니다. 분석 결과, 우수한 커뮤니티는 단순한 대화의 양이 아니라 충성도 높은 핵심 사용자와 상호 보완적인 깊은 대화에 의해 유지된다는 사실을 확인했습니다. 특히, 뚜렷한 커뮤니티 정체성은 내부 결속과 대화의 질을 높이는 핵심 요인으로 작용하는 동시에, 사용자 유입을 제한할 수 있는 성장-정체성 간 상충 관계 (Trade-off)를 형성하는 것으로 나타났습니다. 본 연구는 '성장=성공'이라는 기존 패러다임을 재고하고, 커뮤니티가 단순한 외형적 확장을 넘어 사용자들의 장기적인 웰빙과 신뢰를 구축하는 구조적 관점을 제시합니다. 이는 플랫폼 설계자와 운영자들이 단기적 활성 지표에 의존하기보다, 유의미한 상호작용과 안정적인 구조 유지에 초점을 맞춰야 함을 시사하며, 실질적인 커뮤니티 운영 가이드라인을 제공한다는 점에서 중요한 가치를 지닙니다. 02. (MMsys 2026) “MARs: Multi-Scale Convolution-Attention Residual Fusion for Video Summarization” 논문은 송준석 석박사통합과정(실감미디어공학과)이 제1저자로 참여하였으며, 이주엽 박사과정(인공지능융합학과)과 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 비디오 요약에서 영상의 전체 흐름을 이해하는 능력과 프레임 간 세밀한 변화 포착을 동시에 수행하기 어렵다는 기존 모델의 한계를 해결하기 위해 MARs (Multi-scale Convolution-Attention Residual Fusion) 구조를 제안합니다. Multi-Head Self-Attention을 통해 영상 전체 프레임 간의 장기적인 관계와 스토리 흐름을 학습하고, Multi-Scale Convolution Module을 통해 인접 프레임 사이의 세밀한 변화와 동작 패턴을 함께 포착합니다. 실험 결과, 제안 방법은 SumMe와 TVSum 데이터셋에서 기존 방법보다 높은 성능을 기록하며, 추가적인 오디오나 텍스트 없이 영상 정보만으로도 우수한 요약 성능을 달성했습니다.이 연구는 전역 맥락과 지역적 변화 정보를 동시에 학습하는 구조를 통해 실제 영상 서비스 환경에서 활용 가능한 효율적인 비디오 요약 방법을 제시합니다. 03. (WWW 2026) “AIMER: Affective Intention-guided Multimodal Emotion Reasoner for Visual Emotion Analysis in Social Media” 논문은 이유빈 박사과정 (인공지능융합학과), 박신유 석사과정 (인공지능융합학과), 차준엽 박사과정 (인공지능융합학과), 박지원 석사과정 (실감미디어공학과)이 저자로 참여하였고, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 기존 Vision-Language Model(VLM) 기반 감정 인식이 이미지의 표면적인 시각 단서에 주로 의존하여 감정의 근본적인 의미나 의도를 충분히 반영하지 못하는 문제를 해결하기 위해 AIMER (Affective Intention-guided Multimodal Emotion Reasoner)를 제안합니다. 감정은 단순한 시각 표현이 아니라 인간의 동기와 의도에 의해 형성되는 인지적 과정이라는 관점에서, AIMER는 감정의 외적 표현과 내적 의도를 함께 고려하는 감정 이해 구조를 설계합니다. AIMER는 GPT-5.0을 활용하여 감정의 카테고리, 의도, 추론 정보를 포함한 Intention-aware Emotion Instruction을 생성하고, 이를 이미지에서 추출된 시각 특징과 결합하여 감정을 해석합니다. 생성된 감정 지시문과 시각 임베딩은 Q-Former를 통해 정렬되며, 이를 통해 모델이 단순한 감정 표현 인식을 넘어 감정의 의미와 맥락을 함께 이해하도록 합니다. 또한 Visual Projection과 LLM 사이에 Lightweight Emotion MLP를 추가하여 파라미터 효율적인 방식으로 감정 표현을 보정하고 추론 성능을 향상시킵니다. 이를 통해 AIMER는 다양한 감정 데이터셋에서 기존 vision 기반 및 multimodal 모델보다 우수한 성능을 보이며, 감정의 의도와 맥락을 함께 고려하는 감정 이해 모델로 활용될 수 있음을 보여줍니다. 04. (WWW 2026) “ReMi-ReMath: A Reverse-Mutual Reasoning Framework for Enhancing Mathematical Thinking in Small Language Models” 논문은 김대규 박사과정(인공지능융합학과), 문상규 박사과정(인공지능융합학과)이 참여하였으며, 박은일 교수가 교신저자로 참여하였습니다. 이 논문은 소형 언어 모델이 복잡한 수학적 추론 과정에서 논리적 일관성을 유지하지 못하고, 단순히 정답만 맞히는 현상을 해결하기 위해 ReMi-ReMath 프레임워크를 제안합니다. 기존의 상호 추론 방식이 정답의 일치 여부에만 집중했던 것과 달리, ReMi-ReMath는 추론 과정이 문제의 전제 조건을 충족하는지 검증하는 '논리적 타당성'에 초점을 맞추었습니다. 해당 모델은 Forward Generation - Reverse Reconstruction - Mutual Verification으로 구성되어, 먼저 모델이 문제에 대한 여러 추론 경로를 생성하면, 상호 추론 판별기가 해당 추론 과정과 도출된 정답을 바탕으로 역순으로 문제를 재구성합니다. 그 후, 재구성된 문제와 원래의 문제를 비교하여 수치적 일관성과 의미적 일관성을 측정하는 삼중 일관성을 계산하였습니다. 이를 통해 별도의 미세 조정없이 논리적으로 결함이 있는 추론 경로를 효과적으로 필터링합니다.실험 결과, ReMi-ReMath는 3.8B 규모의 소형 모델에서 기존 rStar 대비 3~5%p의 성능 향상을 기록하며 GSM8K, MATH 등 주요 벤치마크에서 우수한 정확도를 보였습니다. 특히 복잡한 논리가 필요한 고난도 문제에서 두드러진 성과를 거두어, SLM이 단순히 답을 맞히는 수준을 넘어 논리를 이해하고 검증하는 모델로 진화할 수 있는 가능성을 제시하였습니다.