Skip to content

AI 모델

iNotePal은 자연스러운 대화와 정확한 감정 분석을 위해 다양한 자연어 처리(NLP) 모델을 테스트하고 적용했습니다.

1. 감정 분석 모델 (Emotion Analysis)

Section titled “1. 감정 분석 모델 (Emotion Analysis)”

사용자의 문장에서 감정을 추출하기 위해 BERT 기반 모델을 파인튜닝하여 사용했습니다.

  • 모델: KoBERT, RoBERTa 등 다양한 모델 테스트.
  • 학습 데이터: AI Hub 감성 대화 말뭉치 (약 4만 개 문장).
  • 감정 분류: 기쁨, 당황, 분노, 불안, 상처, 슬픔, 중립 (7가지).
  • 성능: 최종 정확도 약 70%.
  • 특징: 한국어 자연어 처리에 특화된 전처리 과정을 거쳐 성능을 최적화했습니다.

2. 챗봇 대화 모델 (Chatbot Response)

Section titled “2. 챗봇 대화 모델 (Chatbot Response)”

사용자의 말에 적절하게 반응하기 위해 검색 기반(Retrieval-based) 방식을 채택했습니다.

  • KoGPT: 생성형 모델. 응답 시간이 길고, 문맥에 맞지 않는 엉뚱한 대답을 하는 경우가 있어 제외됨.
  • Ko-Sentence-Transformers: 문장 임베딩 모델. 최종 채택.

최종 방식: 코사인 유사도 기반 검색

Section titled “최종 방식: 코사인 유사도 기반 검색”
  1. 데이터셋: ‘감성 대화 말뭉치’의 사람-챗봇 대화 쌍을 사용.
  2. 임베딩: 사전에 모든 질문-답변 쌍을 벡터화하여 Supabase Vector DB에 저장.
  3. 검색: 사용자 입력과 가장 코사인 유사도가 높은 질문을 찾고, 그에 매핑된 답변을 반환.
  4. 장점: 서버 부하가 적고 응답 속도가 빠르며, 미리 정의된 양질의 답변을 제공할 수 있음.
  • 전처리: 불용어 제거, 특수문자 처리 등 한국어 특성에 맞는 전처리 수행.
  • 데이터 증강: 데이터 부족 문제를 해결하기 위해 다양한 데이터 가공 시도.