최근 생성형 AI와 대형 언어 모델(LLM)이 급격하게 발전하면서 자연어 처리(NLP) 기술에 대한 관심이 그 어느 때보다 뜨겁습니다. 하지만 화려한 LLM 아키텍처를 이해하고 자유롭게 활용하기 위해서는 결국 가장 기본이 되는 '텍스트 분류(Text Classification)' 메커니즘을 정확히 파악해야 합니다. 텍스트 분류는 스팸 메일 차단, 고객 문의 자동 분류, 영화 리뷰나 SNS 글의 감정 분석 등 이미 우리 일상 속 수많은 소프트웨어에 깊숙이 자리 잡고 있는 핵심 기술입니다.본 포스팅에서는 파이토치(PyTorch)를 활용해 가장 대표적인 NLP 입문 데이터셋인 IMDb 영화 리뷰 데이터를 다루어 봅니다. 텍스트 전처리부터 데이터로더 구성, 그리고 순환 신경망(LSTM)을 이용한 감정 분석 모델..