박호건 교수 연구실(기계학습, 데이터마이닝 연구실)의 추천 시스템 연구The Web Conference (WWW) 2023 논문 게재 승인
- 인공지능학과
- 조회수2082
- 2023-03-02
LearnData Lab(기계학습/데이터마이닝) 연구실(지도교수: 박호건, https://learndatalab.github.io)의 정희수 학생(석사과정)과 박호건 교수(교신저자)가 제출한 “Dual Policy Learning for Aggregation Optimization in Graph Neural Network-based
Recommender Systems” 논문이 웹/데이터 마이닝 분야 최우수 학회 The Web Conference(WWW) 2023 (https://www2023.thewebconf.org) (BK IF=4)에 게재 승인되었고, 2023년 5월 미국 텍사스에서 발표될 예정입니다.
본 논문은 대부분의 최신 추천 시스템의 근간이 되는 그래프 신경망(Graph neural networks; GNN)기반 딥러닝 모델에서 사용 가능한 강화 학습 기반 성능 개선 학습 방법을 제안합니다. 기존GNN 기반 추천 시스템은 멀리 떨어진 이웃의 정보를 집계하여 사용자와 항목 간의 복잡한 고차원적 연결성을 포착하는 장점이 있지만, 사용자와 추천 상품의 이질적인 특성으로 인해 성능 향상에 한계가 있었습니다. 본 논문에서는 추천 시스템을 위한 새로운 강화 학습 기반 메시지 전달 프레임워크인 DPAO(Dual Policy learning framework for Aggregation Optimization)를 제안하며, 이중 정책 학습을 사용하여 사용자 및 상품에 대한 고차 연결을 적응적으로 결정합니다. 제안한 프레임워크는 Amazon, Yelp 포함 6개의 실제 상품 추천 데이터 세트에서 평가하였습니다. 그 결과 본 논문이 제안한 프레임워크가 최근 발표된 GNN기반 추천 시스템 모델을 크게 향상시켜, 대표적인 추천 시스템 평가 지표인nDCG와 Recall에서 각각 최대 63.7%와 42.9%까지 향상시키는 것으로 나타났습니다. 구현 코드와 논문은 본 연구실 홈페이지(https://learndatalab.github.io)에서 확인할 수 있습니다.
[논문 정보]
Heesoo Jung, Sangpil Kim, Hogun Park. Dual Policy Learning for Aggregation Optimization in Recommender Systems, In Proceedings of the ACM 32nd Web Conference: WWW 2023, Austin, USA, 2023.
[Abstract] Graph Neural Networks (GNNs) provide powerful representations for recommendation tasks. GNN-based recommendation systems capture the complex high-order connectivity between users and items by aggregating information from distant neighbors and can improve the performance of recommender systems. Recently, Knowledge Graphs (KGs) have also been incorporated into the user-item interaction graph to provide more abundant contextual information; they are exploited to address cold-start problems and enable more explainable aggregation in GNN-based recommender systems (GNN-Rs). However, due to the heterogeneous nature of users and items, developing an effective aggregation strategy that works across multiple GNN-Rs, such as LightGCN and KGAT, remains a challenge. In this paper, we propose a novel reinforcement learning-based message passing framework for recommender systems, which we call DPAO (Dual Policy learning framework for Aggregation Optimization). This framework adaptively determines high-order connectivity to aggregate users and items using dual policy learning. Dual policy learning leverages two Deep-Q-Network models to exploit the user- and item-aware feedback from a GNN-R and boost the performance of the target GNN-R. Our proposed framework was evaluated with both non-KG-based and KG-based GNN-R models on six real-world datasets, and their results show that our proposed framework significantly enhances the recent base model, improving nDCG and Recall by up to 63.7% and 42.9%, respectively.