데이터 지능 및 학습 연구실(지도교수: 이종욱 교수) 웹 정보 검색 및 자연어 처리 분야 저명한 국제 학술대회(WSDM, WWW, NAACL)에 3편의 논문 게재
- 인공지능학과
- 조회수1944
- 2021-03-25
데이터 지능 및 학습 연구실(지도교수: 이종욱 교수) 웹 정보 검색 및 자연어 처리 분야 저명한 국제 학술대회(WSDM, WWW, NAACL)에 3편의 논문 게재
1. Minjin choi, Yoonki Jeong, Joonseok Lee, Jongwuk Lee, “Local Collaborative Autoencoders” ACM International Conference on Web Search and Data Mining (WSDM), 2021
2. Minjin choi, Jinhong Kim, Joonseok Lee, Hyunjung Shim, Jongwuk Lee, “Session-aware Linear Item-Item Models for Session-based Recommendation” The Web Conference (WWW), 2021
3. Minjin choi, Sunkyung Lee, Eunseong Choi, Heesoo Park, Junhyuk Lee, Dongwon Lee, Jongwuk Lee, “MelBERT: Metaphor Detection via Contextualized Late Interaction using Metaphorical Identification Theories,” Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL), 2021
참여 연구원 명단
최민진, 정윤기, 김진홍, 이선경, 최은성 (왼쪽부터)
1. 사용자 선호도의 지역적 특성을 고려한 추천 모델 개발 (WSDM 2021). 추천 모델은 사용자의 숨겨진 선호도를 추론하여 사용자가 선호하는 소량의 정보를 효과적으로 제공하기 위한 학습 모델을 의미한다. 최근 연구되는 많은 수의 추천 모델은 사용자간 유사한 평점 패턴을 기반으로 추천 결과를 제공하는 협업 필터링을 기반으로 하고 있다. 본 연구진은 기존의 협업 필터링 모델이 모든 사용자의 패턴을 고려하여 학습하기에 특정 사용자의 선호도를 효과적으로 파악하는데 어려움이 있음을 발견하고, 이를 개선하기 위해 지역적 패턴을 고려하여 학습할 수 있는 방법을 제안하였다. 제안 방법을 통해 기존 추천 모델 대비 정확도가 7.95%까지 개선될 수 있음을 확인하였다.
2. 선형 기반 세션 추천 모델 개발 (WWW 2021). 최근 주목을 받고 있는 세션 기반 추천 모델은 (1) 사용자의 정보를 요구하지 않으면서 (2) 특정 세션 내에서 사용자의 숨겨진 선호도를 파악하여 추천 결과를 제공하는 것을 목적으로 한다 (아래 그림 참고). 이와 같은 방식은 사용자 정보를 요구하지 않아 범용적으로 활용성이 높은 장점이 있으나, 기존의 추천 모델 대비 데이터의 희소성이 대폭 증가하여 정확도를 높이기 어려운 단점이 있다. 또한, 실시간으로 결과를 빠르게 제공해야 하는 추천 시스템의 제약 조건도 함께 고려되어야 한다. 본 연구진은 이와 같은 문제를 해결하기 위해 항목 간 관련성을 효과적으로 파악할 수 있는 세션 기반 선형 모델을 제안하였다. 제안 모델은 기존의 많은 학습 파라미터를 통해 정확도를 개선하고자 하는 심층 신경망 기반 추천 모델 대비 파라미터 수가 적고 계산이 간단하기 때문에 빠른 학습 시간과 추론 시간을 보인다. 더하여, 기존의 심층 신경망 모델과 비슷한 추천 정확도를 보임을 확인할 수 있었다
3. BERT 기반 은유 탐지 모델 개발 (NAACL 2021). 은유는 특정 단어에 대해서 행동, 개념 및 물체 등을 유사한 성질을 가진 다른 말로 대체해서 사용하는 비유법 중 하나로 인간의 고차원적인 언어 사용 방법을 의미한다. 예를 들어 “발레리나가 백조 같다.” 고 표현하였을 때, 백조의 의미는 사전의 의미의 동물을 의미하는 것이 아닌 우아한 행동을 비유한 것으로 해석할 수 있다. 본 연구진은 특정 문장에서 은유 표현을 담고 있는 단어를 분류하기 위한 모델을 개발하였으며, 은유 탐지를 위한 두 가지 언어학적 이론을 기반으로 최근 많이 활용되고 있는 언어 이해 모델 중 하나인 BERT에 접목하였다. 실험 결과, 제안 모델은 은유 탐지 분류의 정확도를 VUA 데이터셋에서 F1-Score를 기준으로 79.8%까지 달성함을 확인할 수 있었다.