본문 바로가기
AI-LAB/NLP_Basic

NLP_1_딥러닝 기반 자연어 처리 모델

by JS LAB 2023. 6. 20.
728x90
반응형

기계의 자연어 처리

 

기계가 사람 말을 알아듣는 것처럼 보이게 하려면 어떤 요소들이 있어야 할까?

 

model 

model은 입력을 받아 어떤 처리를 수행하는 함수이다.

 

model의 출력은 확률이다. 확률이란 어떤 사건이 나타날 가능성을 의미하는 수치이며 0에서 1사이의 값으로 나타난다.

 

다시 말해 model은 어떤 입력을 받아 해당 입력이 특정 범주일 확률을 반환하는 확률 함수이다.

 

그렇다면 자연어 처리 모델에서 model의 입력은 무엇일까! 

 

바로 사람의 말, 즉 '자연어' 이다.

 

자연어 처리 모델은 자연어를 입력받아서 해당 입력이 특정 범주일 확률을 반환하는 확률 함수!


딥러닝 모델의 학습

딥러닝 자연어 처리 모델을 만들려면 무엇을 해야할까?

 

우선 데이터를 준비

 

각 문장에 레이블을 달아 놓은 자료가 있어야 한다. 이를 학습 데이터(training data) 라고 한다.

모델이 데이터의 패턴(pattern)을 스스로 익히게 해야한다. 이런 과정을 학습(train)이라고 한다.

 

학습이란 출력이 정답에 가까워지도록 모델을 업데이트하는 과정을 말한다.

 

 

 

 

728x90
반응형

'AI-LAB > NLP_Basic' 카테고리의 다른 글

NLP_6_미리 학습된 모델  (0) 2023.06.26
NLP_4_토큰화란?  (0) 2023.06.21
NLP_3_파인튜닝 외의 다운스트림 태스크 학습법  (0) 2023.06.21
NLP_2_트랜스퍼 러닝  (0) 2023.06.20