감성분석
- 입력된 자연어 안의 주관적 의견, 감정 등을 찾아내는 문제
- 이중 문장의 긍정/부정 등을 구분하는 경우가 많다.
data를 불러오고 label위치를 찾고, label 정보를 모은다.
간단한 cleaning을 진행하였다.
하나의 문장이 몇개의 단어로 이루어져있는지 살펴보았다. 대부분의 문장이 40개의 단어 이하로 이루어져 있다.
25개를 기준으로 자른다. 25개의 단어 이하로 이루어진 문장이라면, pad_sequences를 사용해 알아서 채워주도록 만들어준다.
25개 이하의 문장은 0을 채워준다.
Embedding을 사용하면 자연어 처리임을 알아서 습득한다.
Dense를 2개로 잡은건, 선택의 문제이다.
긍정/부정을 0과 1로 구분하여 본다면 sigmoid로 activation을 지정해서 하나만 빼도 됐으나,
화자는 1-0을 부정이라고 보고, 0-1을 긍정으로 볼 것이기 때문에 출력 2개가 필요하여 softmax를 사용했다.
negative 문장을 test로 넣어봤다.
하나하나 단어가 늘수록 긍정과 부정의 비율이 바뀌는 것을 볼 수 있다.
부정일 확률이 99%가 나온 것을 확인할 수 있다.
'Deep Learning' 카테고리의 다른 글
[DIVE INTO DEEP LEARNING] 4.1 Softmax Regression (0) | 2023.12.20 |
---|---|
[DL] Transformer (0) | 2023.03.03 |
[DL] RNN , LSTM (0) | 2023.02.21 |
[DL] YOLO 사용법 (0) | 2023.02.21 |
[DL] YOLO (0) | 2023.02.19 |