728x90
반응형
언어 모델이란 단어 시퀀스에 확률을 부여하는 모델이다.
문장에서 i번째로 등장하는 단어를
$$w_{i}$$
로 표시하면
n개 단어로 구성된 문장이 해당 언어에서 등장할 확률,
즉, 언어 모델의 출력은 다음 수식처럼 쓸 수 있다
$$P(w_{1},w_{2},w_{3},w_{4},...,w_{n})$$
이 수식은 n개 단어가 동시에 나타날 결합 확률(joint probability)
잘 학습된 한국어 모델이 있다면
P(무모, 운전)
보다
P(난폭, 운전)
이 큰 확률 값을 가질 것
그렇다면 난폭이 나타난 다음 운전이 나타날 확률은 ?
728x90
반응형
'AI-LAB > NLP_Basic' 카테고리의 다른 글
NLP_4_토큰화란? (0) | 2023.06.21 |
---|---|
NLP_3_파인튜닝 외의 다운스트림 태스크 학습법 (0) | 2023.06.21 |
NLP_2_트랜스퍼 러닝 (0) | 2023.06.20 |
NLP_1_딥러닝 기반 자연어 처리 모델 (0) | 2023.06.20 |