'2026/05/12 글 목록

2026/05/12 1

PyTorch 혼합 정밀도 학습(AMP)으로 딥러닝 학습 속도 2배 높이기

핵심 요약학습 속도 향상: FP32 대신 FP16을 사용하여 GPU 연산 속도를 획기적으로 높입니다.메모리 효율화: 메모리 사용량을 줄여 더 큰 배치 사이즈(Batch Size)를 사용할 수 있습니다.간편한 구현: torch.cuda.amp 모듈을 통해 코드 몇 줄만으로 자동 혼합 정밀도(AMP) 학습이 가능합니다.1. 혼합 정밀도 학습(Mixed Precision Training)이란?혼합 정밀도 학습은 딥러닝 모델의 가중치와 연산 과정에서 FP32(32-bit floating point)와 FP16(16-bit floating point)을 혼합하여 사용하는 최적화 기법입니다.대부분의 연산(행렬 곱셈, 컨볼루션 등)은 FP16으로 처리하여 속도를 높이고, 정밀도가 중요한 손실(Loss) 계산이나 가중..

Python for AI, Embedded/Deep Learning: PyTorch & AI Modeling 2026.05.12

소프트웨어 공장

임베디드 소프트웨어 개발을 위한 팁과 정보를 제공하는 '소프트웨어 공장'입니다. 함께 성장하는 개발 친구가 되어드릴게요!

ConstraintLayout, 온디바이스AI, NPU, android audio hal, FreeRTOS, 임베디드개발, framework service, compression algorithm, 딥러닝, can, android daemon, android hal, aws iot device, pytorch, numpy array, DeepX, canopen, android system service, shell script, SciPy.optimize,

Today :
Yesterday :

728x90

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

2026/05/12 1

티스토리툴바