'tensor' 태그의 글 목록

tensor 2

PyTorch GPU(CUDA) 설정 및 사용법 완벽 가이드: 성능 10배 높이기

핵심 요약 3줄병렬 연산의 최적화: CPU의 소수 정예 코어 대신 GPU의 수천 개 코어를 활용해 대규모 행렬 연산 속도를 혁신적으로 높입니다.통합 디바이스 설정: torch.device를 활용해 CPU와 GPU 환경 어디서든 유동적으로 동작하는 코드 작성이 가능합니다.데이터 일치 필수: 모델과 텐서가 동일한 장치(Device)에 위치해야 런타임 에러를 방지하고 정상적인 연산을 수행할 수 있습니다.1. CUDA 개요: 왜 GPU를 사용해야 할까?CUDA(Compute Unified Device Architecture)는 NVIDIA가 개발한 병렬 컴퓨팅 플랫폼입니다. 딥러닝 모델 학습에는 수많은 행렬 곱셈이 포함되는데, 이는 병렬 처리에 특화된 GPU에서 실행할 때 CPU 대비 압도적인 성능을 발휘합니다..

Python for AI, Embedded/Deep Learning: PyTorch & AI Modeling 2026.05.10

PyTorch 텐서(Tensor) 핵심 정리: view vs reshape 차이와 성능 최적화

핵심 요약 3줄PyTorch 텐서(Tensor)는 NumPy와 유사한 다차원 배열 구조이지만, GPU 가속과 자동 미분을 지원하여 딥러닝 최적화에 필수적입니다.from_numpy나 view와 같은 Zero-copy 방식을 활용하면 불필요한 메모리 복사를 방지해 임베디드 장치에서도 효율적인 연산이 가능합니다.텐서의 형태 변환(view, reshape) 및 차원 조작(squeeze) 시 메모리 연속성과 데이터 공유 여부를 파악하는 것이 성능의 핵심입니다.1. PyTorch 텐서(Tensor)란?텐서는 딥러닝 모델의 데이터를 저장하고 연산하는 기본 단위입니다. 단순한 숫자의 나열처럼 보이지만, 강력한 기능을 내포하고 있습니다.특징설명비고다차원 배열스칼라(0D)부터 고차원 텐서까지 유연하게 표현 가능NumPy와..

Python for AI, Embedded/Deep Learning: PyTorch & AI Modeling 2026.04.24

1

더보기

소프트웨어 공장

소프트웨어 공장 (Software Factory) — System & Embedded Software Engineering 시스템의 가장 낮은 곳(Low-level)에서부터 사용자에게 닿는 플랫폼 레이어까지, 핵심 엔지니어링 기술을 기록하고 공유하는 공간입니다. 주로 다루는 기술 영역: Embedded & Firmware: Bootloader(U-Boot, Fastboot), Linux Kernel & Device Driver, FreeRTOS, STM

FreeRTOS, AOSP, framework service, android system service, AI, compression algorithm, embeddedsystems, HardFault, shell script, android hal, BareMetal, EmbeddedC, android daemon, CNN, canopen, 온디바이스AI, cortexm, aws iot device, android audio hal, pytorch,

Today :
Yesterday :

티스토리툴바