Transformer 모델의 개념 및 기초 구현1. Transformer 모델이란?Transformer 모델은 자연어 처리(NLP)에서 혁신적인 변화를 가져온 딥러닝 모델로, 기존의 RNN(Recurrent Neural Network) 기반 모델의 한계를 극복하고자 제안되었습니다. 이 모델은 2017년 Vaswani et al.의 논문 *"Attention Is All You Need"*에서 처음 소개되었으며, 이후 BERT, GPT, T5 등 다양한 변형 모델이 등장하며 NLP의 핵심 기술로 자리 잡았습니다.Transformer의 주요 특징Self-Attention 메커니즘: 문장 내 단어들이 서로를 참조할 수 있도록 하여 장기 의존성(Long-range dependency)을 효과적으로 처리합니다.병..