핵심 요약 3줄병렬 연산의 최적화: CPU의 소수 정예 코어 대신 GPU의 수천 개 코어를 활용해 대규모 행렬 연산 속도를 혁신적으로 높입니다.통합 디바이스 설정: torch.device를 활용해 CPU와 GPU 환경 어디서든 유동적으로 동작하는 코드 작성이 가능합니다.데이터 일치 필수: 모델과 텐서가 동일한 장치(Device)에 위치해야 런타임 에러를 방지하고 정상적인 연산을 수행할 수 있습니다.1. CUDA 개요: 왜 GPU를 사용해야 할까?CUDA(Compute Unified Device Architecture)는 NVIDIA가 개발한 병렬 컴퓨팅 플랫폼입니다. 딥러닝 모델 학습에는 수많은 행렬 곱셈이 포함되는데, 이는 병렬 처리에 특화된 GPU에서 실행할 때 CPU 대비 압도적인 성능을 발휘합니다..