본문 바로가기
AI-LAB/논문리뷰

Modeling Interactions Between Stocks Using LLM-Enhanced Graphs for Volume Prediction

by JS LAB 2025. 2. 16.
728x90
반응형

Modeling Interactions Between Stocks Using LLM-Enhanced Graphs for Volume Prediction


1) 저널/학회 및 연도

  • Proceedings of the Joint Workshop of the 9th FinNLP, the 6th FNP, and the 1st LLMFinLegal(2025)
  • 출판 연도: 2025년
  • 주최: Association for Computational Linguistics (ACL)

2) 논문 제목

  • Modeling Interactions Between Stocks Using LLM-Enhanced Graphs for Volume Prediction

3) 논문의 주제

  • 대형 언어 모델(LLM)을 활용한 주식 간 상호작용 모델링
  • 거래량 예측을 위한 동적 그래프 신경망(LED-GNN) 프레임워크 제안
  • 뉴스 데이터를 활용하여 주식 간의 관계를 그래프로 모델링하고 이를 활용해 거래량 예측 성능을 향상

4) 해당 논문 이전 연구들

  • 기존 주식 예측 모델
    • 그래프 신경망(GNN) 기반 주가 예측 연구 (Sawhney et al., 2021; Kim et al., 2019)
    • 금융 뉴스 데이터를 활용한 주가 예측 (Zhao et al., 2021)
  • 기존 한계점
    • 대부분의 연구가 뉴스 데이터를 노드(feature) 정보로만 활용
    • 뉴스 속 **주식 간 관계(엣지 정보)**를 활용한 연구는 부족
    • 기존 연구에서는 뉴스 기사 내에서 주식 간의 동적 관계를 추출하는 방법론이 부재

5) 논문의 제안과 그 제안의 핵심 방법론

  • LLM 기반 뉴스 관계 추출 모델
    • 뉴스 데이터를 분석하여 주식 간 관계를 동적 그래프 형태로 변환
    • 관계 정보를 LLM을 활용해 추출하고, 노드 간 엣지로 반영
  • LED-GNN (LLM-Enhanced Dynamic Graph Neural Network)
    • 뉴스 데이터를 바탕으로 동적 뉴스 그래프(News Relation Graph) 구축
    • 기존 주가 및 거래량 데이터를 활용한 시공간 주식 그래프(Spatiotemporal Stock Graph) 구축
    • 두 개의 그래프를 GNN 및 GATv2-LSTM 구조를 통해 통합하여 예측 성능 향상

6) 논문에 사용된 데이터, 모델 등

  • 데이터셋
    • TOPIX500 (Tokyo Stock Exchange): 일본 도쿄 증권거래소의 500개 상장 주식 데이터
    • Reuters Financial News: 금융 뉴스 데이터 (146,474개 기사)
    • 기간: 2013년 1월 ~ 2018년 10월
  • 모델
    • Mistral-7B: 뉴스에서 주식 간 관계 추출
    • Sentence-BERT & HDBSCAN: 관계 정제(Relation Reduction)
    • GATv2-LSTM: 동적 그래프 기반 예측 모델

7) 제안 방법으로부터의 결과, 비교

Baseline 모델과 비교

모델 MSE ↓ RMSE ↓ MAE ↓ SMAPE ↓
LED-GNN 0.153 0.391 0.293 0.680
RTGCN 0.160 0.400 0.299 0.704
LSTM 0.157 0.396 0.297 0.699
TCN 0.159 0.398 0.298 0.702

Ablation Study (서브모듈 기여도 분석)

실험 조건 MSE ↑ RMSE ↑ MAE ↑ SMAPE ↑
w/o 뉴스 그래프 0.155 0.393 0.295 0.691
w/o 주식 그래프 0.155 0.394 0.295 0.692
랜덤 그래프 사용 0.159 0.396 0.299 0.695

8) 논문의 novelty

  • LLM을 활용해 뉴스 데이터에서 주식 간 관계를 추출하고, 이를 그래프의 엣지 정보로 활용
  • 기존 연구에서는 뉴스 데이터를 단순히 feature로만 활용했으나, 본 논문은 동적 그래프로 변환하여 예측 성능을 개선
  • 뉴스 기반 관계 추출을 활용한 동적 GNN 구조는 최초의 시도

9) 논문의 기여도

  • 뉴스 데이터에서 주식 간 관계를 자동으로 학습하는 방법론 제시
  • LLM을 이용하여 동적 그래프를 생성하는 새로운 접근법
  • 기존 RNN/LSTM 기반 모델 대비 성능 향상
  • 금융 도메인에서 활용 가능한 뉴스 기반 GNN 모델의 가능성을 검증

10) 논문의 약점 및 보완점

  • LLM을 활용한 관계 추출 비용
    • LLM 추론 비용이 높아 실시간 적용 가능성은 추가 연구 필요
  • 다양한 시장 데이터 적용 가능성 부족
    • TOPIX500 외 다른 시장(S&P 500, KOSPI 등)에 대한 실험이 부족
  • 최신 벡터 검색 기반 금융 모델과 비교 부족
    • BloombergGPT 같은 최신 금융 LLM과 비교 실험이 없다는 점이 아쉬움

11) 향후 연구 방향

  • 다른 주식 시장 데이터(S&P 500, NASDAQ 등)로 확장 실험
  • 최신 금융 특화 LLM과 결합하여 검색 성능 향상 연구
  • 모델 경량화 및 실시간 적용 가능성 탐색
  • 거래량뿐만 아니라 주가 변동 예측에도 적용 가능성 검토

12) 총평

  • 강점
    • 뉴스 데이터를 활용한 주식 간 관계 추출 및 동적 그래프 모델링이라는 신선한 아이디어
    • 기존 주식 예측 모델 대비 높은 성능 향상 입증
    • 금융 도메인에서 LLM과 GNN을 결합한 새로운 접근법 제시
  • 약점
    • LLM 사용으로 인한 높은 연산 비용
    • 다양한 금융 시장에 대한 실험 부족
  • 종합 평가
    • 실제 금융 시장에 적용 가능성이 높은 혁신적인 연구
    • 추가적인 최적화 및 벤치마킹이 필요하지만, 금융 AI 연구에 중요한 기여를 함
728x90
반응형