728x90
반응형
Modeling Interactions Between Stocks Using LLM-Enhanced Graphs for Volume Prediction
1) 저널/학회 및 연도
- Proceedings of the Joint Workshop of the 9th FinNLP, the 6th FNP, and the 1st LLMFinLegal(2025)
- 출판 연도: 2025년
- 주최: Association for Computational Linguistics (ACL)
2) 논문 제목
- Modeling Interactions Between Stocks Using LLM-Enhanced Graphs for Volume Prediction
3) 논문의 주제
- 대형 언어 모델(LLM)을 활용한 주식 간 상호작용 모델링
- 거래량 예측을 위한 동적 그래프 신경망(LED-GNN) 프레임워크 제안
- 뉴스 데이터를 활용하여 주식 간의 관계를 그래프로 모델링하고 이를 활용해 거래량 예측 성능을 향상
4) 해당 논문 이전 연구들
- 기존 주식 예측 모델
- 그래프 신경망(GNN) 기반 주가 예측 연구 (Sawhney et al., 2021; Kim et al., 2019)
- 금융 뉴스 데이터를 활용한 주가 예측 (Zhao et al., 2021)
- 기존 한계점
- 대부분의 연구가 뉴스 데이터를 노드(feature) 정보로만 활용
- 뉴스 속 **주식 간 관계(엣지 정보)**를 활용한 연구는 부족
- 기존 연구에서는 뉴스 기사 내에서 주식 간의 동적 관계를 추출하는 방법론이 부재
5) 논문의 제안과 그 제안의 핵심 방법론
- LLM 기반 뉴스 관계 추출 모델
- 뉴스 데이터를 분석하여 주식 간 관계를 동적 그래프 형태로 변환
- 관계 정보를 LLM을 활용해 추출하고, 노드 간 엣지로 반영
- LED-GNN (LLM-Enhanced Dynamic Graph Neural Network)
- 뉴스 데이터를 바탕으로 동적 뉴스 그래프(News Relation Graph) 구축
- 기존 주가 및 거래량 데이터를 활용한 시공간 주식 그래프(Spatiotemporal Stock Graph) 구축
- 두 개의 그래프를 GNN 및 GATv2-LSTM 구조를 통해 통합하여 예측 성능 향상
6) 논문에 사용된 데이터, 모델 등
- 데이터셋
- TOPIX500 (Tokyo Stock Exchange): 일본 도쿄 증권거래소의 500개 상장 주식 데이터
- Reuters Financial News: 금융 뉴스 데이터 (146,474개 기사)
- 기간: 2013년 1월 ~ 2018년 10월
- 모델
- Mistral-7B: 뉴스에서 주식 간 관계 추출
- Sentence-BERT & HDBSCAN: 관계 정제(Relation Reduction)
- GATv2-LSTM: 동적 그래프 기반 예측 모델
7) 제안 방법으로부터의 결과, 비교
① Baseline 모델과 비교
모델 | MSE ↓ | RMSE ↓ | MAE ↓ | SMAPE ↓ |
---|---|---|---|---|
LED-GNN | 0.153 | 0.391 | 0.293 | 0.680 |
RTGCN | 0.160 | 0.400 | 0.299 | 0.704 |
LSTM | 0.157 | 0.396 | 0.297 | 0.699 |
TCN | 0.159 | 0.398 | 0.298 | 0.702 |
② Ablation Study (서브모듈 기여도 분석)
실험 조건 | MSE ↑ | RMSE ↑ | MAE ↑ | SMAPE ↑ |
---|---|---|---|---|
w/o 뉴스 그래프 | 0.155 | 0.393 | 0.295 | 0.691 |
w/o 주식 그래프 | 0.155 | 0.394 | 0.295 | 0.692 |
랜덤 그래프 사용 | 0.159 | 0.396 | 0.299 | 0.695 |
8) 논문의 novelty
- LLM을 활용해 뉴스 데이터에서 주식 간 관계를 추출하고, 이를 그래프의 엣지 정보로 활용
- 기존 연구에서는 뉴스 데이터를 단순히 feature로만 활용했으나, 본 논문은 동적 그래프로 변환하여 예측 성능을 개선
- 뉴스 기반 관계 추출을 활용한 동적 GNN 구조는 최초의 시도
9) 논문의 기여도
- 뉴스 데이터에서 주식 간 관계를 자동으로 학습하는 방법론 제시
- LLM을 이용하여 동적 그래프를 생성하는 새로운 접근법
- 기존 RNN/LSTM 기반 모델 대비 성능 향상
- 금융 도메인에서 활용 가능한 뉴스 기반 GNN 모델의 가능성을 검증
10) 논문의 약점 및 보완점
- LLM을 활용한 관계 추출 비용
- LLM 추론 비용이 높아 실시간 적용 가능성은 추가 연구 필요
- 다양한 시장 데이터 적용 가능성 부족
- TOPIX500 외 다른 시장(S&P 500, KOSPI 등)에 대한 실험이 부족
- 최신 벡터 검색 기반 금융 모델과 비교 부족
- BloombergGPT 같은 최신 금융 LLM과 비교 실험이 없다는 점이 아쉬움
11) 향후 연구 방향
- 다른 주식 시장 데이터(S&P 500, NASDAQ 등)로 확장 실험
- 최신 금융 특화 LLM과 결합하여 검색 성능 향상 연구
- 모델 경량화 및 실시간 적용 가능성 탐색
- 거래량뿐만 아니라 주가 변동 예측에도 적용 가능성 검토
12) 총평
- 강점
- 뉴스 데이터를 활용한 주식 간 관계 추출 및 동적 그래프 모델링이라는 신선한 아이디어
- 기존 주식 예측 모델 대비 높은 성능 향상 입증
- 금융 도메인에서 LLM과 GNN을 결합한 새로운 접근법 제시
- 약점
- LLM 사용으로 인한 높은 연산 비용
- 다양한 금융 시장에 대한 실험 부족
- 종합 평가
- 실제 금융 시장에 적용 가능성이 높은 혁신적인 연구
- 추가적인 최적화 및 벤치마킹이 필요하지만, 금융 AI 연구에 중요한 기여를 함
728x90
반응형