데이터 불균형 처리 방법과 SMOTE 기법1. 데이터 불균형이란?머신러닝 및 딥러닝 모델을 학습할 때, 데이터셋의 클래스 분포가 균형을 이루는 것이 이상적입니다. 하지만 현실에서는 특정 클래스의 데이터가 매우 적거나 많은 경우가 발생하는데, 이를 데이터 불균형(Imbalanced Data)이라고 합니다.예를 들어, 의료 데이터에서 특정 질병을 가진 환자의 수는 건강한 사람보다 훨씬 적은 경우가 많습니다. 이처럼 데이터 불균형이 심한 경우, 머신러닝 모델은 다수 클래스를 우선적으로 학습하고 소수 클래스에 대한 예측 성능이 떨어지는 문제가 발생할 수 있습니다.2. 데이터 불균형이 문제를 일으키는 이유데이터 불균형이 있는 경우 모델이 학습 과정에서 다음과 같은 문제를 일으킬 수 있습니다.모델이 다수 클래스를 ..