소프트웨어 공장

전체 글 1163

ARM Cortex-A 및 Cortex-M 간 Inter-Processor Interrupt (IPI) 및 Mailbox IP 레지스터 레벨 분석

비대칭형 멀티프로세싱(AMP) 환경에서 Inter-Processor Interrupt (IPI) 및 Mailbox IP 도입 배경모던 이기종 멀티코어(AMP) 시스템 아키텍처에서 고성능 애플리케이션을 구동하는 ARM Cortex-A 코어와 실시간 제어를 담당하는 ARM Cortex-M 코어는 독립된 운영체제를 실행합니다. 두 프로세서가 물리 메모리 공간을 공유하며 데이터를 교환하기 위해서는 상대방 코어에게 데이터가 준비되었음을 알리는 물리적인 통지 메커니즘이 필요합니다. 폴링(Polling) 방식을 사용하면 프로세서 자원이 낭비되고 반응 속도가 지연됩니다. 따라서 하드웨어 수준에서 신호를 전송하는 Inter-Processor Interrupt (IPI) 및 전용 Mailbox IP 하드웨어 사용이 이점이..

AMP & Heterogeneous IPC 20:13:27

AMP 시스템의 Reserved Memory 영역 분할 및 하드웨어 자원 격리 메커니즘 분석

비대칭형 멀티프로세싱(AMP) 환경에서 하드웨어 자원 격리 및 제어가 필요한 배경모던 이기종 시스템 온 칩(Heterogeneous SoC) 환경에서 Linux를 구동하는 ARM Cortex-A 클러스터와 RTOS를 구동하는 Cortex-M 코어는 하나의 물리적 시스템 메모리(DRAM/SRAM)와 주변장치(Peripherals)를 공유합니다. 만약 두 코어가 동일한 메모리 주소 공간에 동시에 접근하거나 시스템 인터럽트를 중복 제어하면, 데이터 오염(Data Corruption)과 메모리 결함 에러가 발생하여 전체 시스템이 정지합니다. 개발자는 두 코어가 서로의 실행 영역을 침범하지 않도록 시스템 자원을 완전하게 파티셔닝해야 합니다. 이번 포스팅에서는 Linux 커널의 디바이스 트리(Device Tree)..

AMP & Heterogeneous IPC 2026.07.08

ARM Cortex-A 및 Cortex-M 기반 SMP vs AMP 동시 구현 분석

모던 임베디드 아키텍처는 고성능 애플리케이션 데이터 연산 처리와 마이크로초(µs) 단위의 엄격한 실시간 하드웨어 제어를 동시에 요구합니다. 단일 운영체제나 동일한 구조의 프로세서 코어 클러스터만으로는 이러한 상충된 요구사항을 충족하기 어렵습니다. 고성능 애플리케이션 프로세서는 Linux 같은 복잡한 OS를 구동하는 데 적합하지만 비결정론적(Non-deterministic) 스케줄링 특성 때문에 실시간 제어 타이밍을 보장하지 못합니다. 반대로 실시간 마이크로컨트롤러는 연산 성능이 부족하고 MMU가 없어 복잡한 네트워크 스택이나 그래픽 유저 인터페이스를 효율적으로 처리할 수 없습니다.이러한 문제를 해결하기 위해 최신 반도체 제조사들은 단일 실리콘 다이(Die) 위에 서로 다른 목적을 가진 코어들을 배치하는 ..

AMP & Heterogeneous IPC 2026.07.07

안드로이드 네이티브 메모리 누수 분석: Malloc Debug, Libmemunreachable, ASan 활용 가이드

[내용요약]문제: 안드로이드 시스템 장기 구동 시 Native Daemon 및 HAL 프로세스의 가상 메모리 크기(VSS)와 상주 메모리 크기(RSS)가 지속적으로 증가하다가 결국 커널 OOM(Out of Memory) Killer에 의해 프로세스가 강제 종료(SIGKILL)되는 현상 발생.원인: C/C++ 기반 네이티브 레이어에서 dynamic allocation 후 free() 또는 delete 연산자가 누락되거나, 스마트 포인터의 순환 참조(Circular Reference)로 인해 힙 heap 메모리 해제가 누락되는 현상.해결책: AOSP 환경에서 Malloc Debug를 활성화하여 동적 할당 스택을 추적하고, libmemunreachable을 통해 런타임에 메모리 가비지 컬렉션(GC) 스타일의 ..

Advanced Debugging & Observability 2026.07.06

안드로이드 오디오 버퍼 언더런 및 UI Jank 분석: Perfetto 기반 컨텍스트 스위칭 지연 추적 가이드

[내용요약]문제: 안드로이드 플랫폼 런타임 중 간헐적인 오디오 끊김(Audio Underrun) 및 UI 버벅임(Graphic Jank) 현상으로 인한 실시간 멀티미디어 스트리밍 품질 저하.원인: 커널 및 프레임워크 레벨에서 스레드 간 우선순위(Inverted Priority) 역전, 동기화 블록(Lock Contention) 고착, 또는 CPU 코어 마이그레이션 지연으로 인한 컴포넌트 간 컨텍스트 스위칭(Context Switching) 스케줄링 병목.해결책: 차세대 시스템 프로파일링 도구인 Perfetto 트레이스를 활용하여 AudioServer, SurfaceFlinger, 커널 스케줄러(sched_switch)의 타임라인을 교차 검증하고 병목 스레드를 식별하여 스케줄러 우선순위 조정 및 락 경합 ..

Advanced Debugging & Observability 2026.07.05

AOSP 시스템 프로파일링 최적화: Systrace에서 Perfetto 전환 및 SQL 쿼리 분석 가이드

내용요약문제: 안드로이드 시스템(AOSP) 빌드 환경 또는 고부하 런타임에서 기존 Systrace 사용 시 구형 Python 2.7 의존성 문제로 실행이 불가하거나, 대용량 트레이스 버퍼 저장 시 메모리 고갈로 크래시되는 현상.원인: Systrace의 레거시 아키텍처는 수백 MB 이상의 대용량 이벤트를 단일 HTML 파일로 덤프하여 프론트엔드 단에서 파싱하므로, 데이터 유실(Dropped Events) 및 타임라인 렌더링 병목이 한계.해결책: 차세대 프로파일링 도구인 Perfetto 프로토콜 버퍼(Protobuf) 기반 파이프라인을 도입, Perfetto UI 및 내장 SQLite 엔진 기반 SQL Query를 사용하여 시스템 전체 데이터(App, Framework, Native, Kernel)를 저오버..

Advanced Debugging & Observability 2026.07.04

eBPF 기반 리눅스 커널 메모리 누수(Memory Leak) 및 좀비 프로세스(Zombie Process) 추적 가이드

내용 요약현상: 장시간 구동 시 메모리가 지속적으로 감소하고 [defunct] 상태의 좀비 프로세스가 쌓여 PID 자원이 고갈됨.원인: 메모리 할당 후 해제(free/kfree)가 누락되는 메모리 누수와, 종료된 자식 프로세스의 수거(waitpid)가 누락되는 좀비 프로세스 누적.해결: eBPF 기반의 kprobe/uprobe를 활용해 메모리 할당·해제 이벤트를 실시간으로 추적 및 대조하여 누수와 고립 리소스를 탐지.리눅스 시스템 메모리 고갈(Memory Exhaustion) 및 좀비 프로세스 누적 증상리눅스 기반 임베디드 장치 및 서버 환경을 장기 운용할 때, 물리 메모리(RAM)의 여유 공간이 서서히 줄어들다가 결국 커널의 OOM Killer (Out of Memory Killer)가 동작하여 데몬을..

Advanced Debugging & Observability 2026.07.03

eBPF 기반 파일 I/O 및 네트워크 지연(Latency) 추적기 구현 가이드 (bcc / bpftrace 실습)

내용 요약현상: 기존 모니터링 도구(top, iostat)로는 특정 프로덕션 환경의 간헐적인 파일 I/O 및 네트워크 지연을 유발하는 커널 콜 스택 병목 지점을 특정할 수 없음.원인: 동적 트레이싱 도구가 없어 가상 파일 시스템(VFS), 블록 레이어, TCP 스택 등 커널 스페이스 내부의 세부 지연 시간을 정밀하게 계측하지 못함.해결: eBPF 기반의 bcc 및 bpftrace를 활용해 주요 커널 함수에 kprobe/kretprobe를 부착하고, 마이크로초($\mu\text{s}$) 단위의 지연 시간을 비침습적으로 측정 및 시각화함.리눅스 프로덕션 환경의 파일 I/O 및 네트워크 지연(Latency Breakdown) 발생 증상엔터프라이즈 리눅스 시스템을 운영하다 보면 Storage I/O Bottle..

Advanced Debugging & Observability 2026.07.02

Linux eBPF 커널 트레이싱 가이드: ftrace 및 perf 대비 오버헤드와 패러다임 비교

내용 요약현상: 고부하 리눅스 시스템에서 기존 방식으로 대량의 커널 이벤트를 트레이싱할 때, 과도한 컨텍스트 스위칭과 디스크 I/O로 인해 시스템 지연 및 패킷 드롭이 발생함.원인: 전통적인 도구들은 커널의 방대한 데이터를 유저 공간으로 일일이 복사한 뒤 필터링하므로, 메모리 대역폭 소모와 컨텍스트 스위칭 병목이 유발됨.해결: eBPF의 인-커널 가상 머신과 Map 구조를 활용해 커널 내부에서 실시간으로 데이터를 요약·필터링함으로써, 유저 공간으로의 복사 오버헤드를 최소화함.리눅스 커널 트레이싱 오버헤드 및 시스템 락업 증상 (Linux Kernel Tracing Overhead & High-Load System Lock-up Symptoms)커널 레벨의 모니터링을 위해 고부하 상용 운영 환경(Produ..

Advanced Debugging & Observability 2026.07.01

코어 덤프 분석 및 레지스터 스택 프레임 복원 방법: ARM Cortex-M 하드폴트 역추적 가이드

내용 요약현상: 예기치 못한 HardFault 크래시 혹은 HardFault_Handler에서 멈추는 현상.원인: 유효하지 않은 메모리 참조 또는 잘못된 함수 포인터 호출로 Stack Frame을 Push한 상태로 실시간 연결이 끊어지는 문제.해결: 스택에 저장된 PC(Program Counter)와 LR(Link Register) 레지스터의 컨텍스트를 Core Dump 메모리 버퍼에서 역추적.펌웨어 크래시와 코어 덤프 메모리 유실 증상 (Firmware Crash & Core Dump Memory Loss Symptoms)임베디드 장치가 필드에 배포된 이후 발생하는 간헐적인 시스템 다운(System Lock-up) 현상은 실시간 디버거(J-Link, ST-Link)를 연결할 수 없어 원인 파악이 어렵습..

Advanced Debugging & Observability 2026.06.30

1 2 3 4 ··· 117

소프트웨어 공장

소프트웨어 공장 (Software Factory) — System & Embedded Software Engineering 시스템의 가장 낮은 곳(Low-level)에서부터 사용자에게 닿는 플랫폼 레이어까지, 핵심 엔지니어링 기술을 기록하고 공유하는 공간입니다. 주로 다루는 기술 영역: Embedded & Firmware: Bootloader(U-Boot, Fastboot), Linux Kernel & Device Driver, FreeRTOS, STM

cortexm, embeddedsystems, AOSP, aws iot device, android audio hal, android system service, compression algorithm, pytorch, android daemon, canopen, CNN, AI, framework service, shell script, FreeRTOS, HardFault, BareMetal, android hal, 온디바이스AI, EmbeddedC,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

전체 글 1163

티스토리툴바