AI-LAB/NLP_Basic

NLP_6_미리 학습된 모델

JS LAB 2023. 6. 26. 00:23
728x90
반응형

언어 모델이란 단어 시퀀스에 확률을 부여하는 모델이다.

 

문장에서 i번째로 등장하는 단어를

 

$$w_{i}$$

 

로 표시하면

 

n개 단어로 구성된 문장이 해당 언어에서 등장할 확률,

 

즉, 언어 모델의 출력은 다음 수식처럼 쓸 수 있다

 

$$P(w_{1},w_{2},w_{3},w_{4},...,w_{n})$$

 

이 수식은 n개 단어가 동시에 나타날 결합 확률(joint probability)

 

잘 학습된 한국어 모델이 있다면

 

P(무모, 운전)

 

보다

 

P(난폭, 운전)

 

이 큰 확률 값을 가질 것

 

그렇다면 난폭이 나타난 다음 운전이 나타날 확률은 ?

 

 

 

 

 

 

 

 
 
 
 
728x90
반응형