728x90
반응형

전체 글 994

Pandas 내장 시각화 기능 (plot()) 활용하기

Pandas 내장 시각화 기능 (plot()) 활용하기데이터 분석을 하다 보면 데이터의 패턴을 시각적으로 파악하는 것이 중요합니다. Pandas는 Matplotlib을 기반으로 하는 기본적인 시각화 기능을 제공하며, plot() 메서드를 활용하여 손쉽게 그래프를 그릴 수 있습니다. 이번 글에서는 Pandas의 plot() 메서드를 이용한 다양한 그래프를 소개하고 예제와 함께 살펴보겠습니다.1. 데이터 준비우선, 예제 데이터를 생성하여 Pandas의 기본적인 시각화 기능을 실습해 보겠습니다.import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 예제 데이터 생성df = pd.DataFrame({ '날짜': pd.date_range(..

Python/Pandas 2025.10.15

NumPy로 배우는 선형대수: 고유값과 고유벡터

NumPy로 배우는 선형대수: 고유값과 고유벡터선형대수는 데이터 과학과 기계 학습에서 필수적인 도구입니다. 특히, 고유값(eigenvalue)과 고유벡터(eigenvector)는 데이터 차원 축소, PCA(주성분 분석), 행렬 분해 등 다양한 응용에서 사용됩니다. 이번 포스팅에서는 Python의 NumPy 라이브러리를 사용하여 고유값과 고유벡터를 계산하고, 이를 이해하는 방법을 소개합니다.1. 고유값과 고유벡터란?고유값과 고유벡터는 다음과 같은 행렬 방정식을 만족하는 값과 벡터를 의미합니다:[ A \mathbf{v} = \lambda \mathbf{v} ]여기서:( A ): 정방 행렬 (n x n)( \mathbf{v} ): 고유벡터( \lambda ): 고유값쉽게 말해, 고유벡터는 행렬 ( A )에 의..

Python/NumPy 2025.10.15

Pandas 데이터 프레임 결합: merge()와 concat()

Pandas 데이터 프레임 결합: merge()와 concat()데이터 분석을 진행하다 보면 여러 개의 데이터 프레임을 하나로 합쳐야 하는 경우가 자주 발생합니다. Pandas에서는 merge()와 concat() 함수를 사용하여 데이터 프레임을 결합할 수 있습니다. 두 함수는 사용 목적이 다르므로 각각의 특징과 차이점을 이해하는 것이 중요합니다.이 글에서는 merge()와 concat()을 사용하는 방법을 실용적인 예제와 함께 설명하겠습니다.1. merge()를 이용한 데이터 프레임 병합1.1 merge()란?merge() 함수는 SQL의 JOIN과 유사하게 두 개의 데이터 프레임을 특정 열 또는 인덱스를 기준으로 병합할 때 사용됩니다.1.2 merge() 기본 사용법import pandas as pd..

Python/Pandas 2025.10.14

NumPy 선형대수 기초: 역행렬, 전치행렬, 행렬식

NumPy 선형대수 기초: 역행렬, 전치행렬, 행렬식NumPy는 파이썬에서 과학 계산 및 데이터 분석을 위한 강력한 라이브러리입니다. 이 포스팅에서는 NumPy의 선형대수 기능 중에서도 역행렬, 전치행렬, 행렬식을 다룹니다. 각 개념에 대해 설명하고, 코드를 통해 예제를 살펴보겠습니다.1. 역행렬 (Inverse Matrix)역행렬은 어떤 정사각행렬 ( A )에 대해 다음을 만족하는 행렬 ( B )를 의미합니다:[ A \times B = B \times A = I ]여기서 ( I )는 단위행렬(Identity Matrix)입니다. 역행렬은 행렬이 정칙(Determinant가 0이 아님)일 때만 존재합니다.NumPy에서의 역행렬 계산NumPy의 numpy.linalg.inv 함수를 사용하면 역행렬을 쉽게 ..

Python/NumPy 2025.10.14

Pandas Pivot Table 활용 (pivot_table())

Pandas Pivot Table 활용 (pivot_table())데이터 분석을 진행하다 보면 데이터를 요약하고 집계해야 하는 경우가 많습니다. Pandas의 pivot_table() 함수는 이러한 데이터 요약을 편리하게 수행할 수 있도록 도와주는 강력한 도구입니다. 이번 포스팅에서는 pivot_table()의 개념과 활용법을 예제와 함께 살펴보겠습니다.1. Pivot Table이란?Pivot Table(피벗 테이블)은 특정 기준에 따라 데이터를 그룹화하고, 해당 그룹의 값을 집계하여 요약된 형태로 보여주는 테이블입니다. pivot_table() 함수는 다음과 같은 기능을 제공합니다.데이터를 그룹화하여 요약여러 개의 집계 함수를 적용 가능멀티 인덱스를 활용한 다차원 분석 가능Pandas에서 제공하는 pi..

Python/Pandas 2025.10.13

NumPy 선형대수: 행렬 곱셈 (dot, matmul)

NumPy 선형대수: 행렬 곱셈 (dot, matmul)선형대수학은 데이터 과학, 머신 러닝, 과학 계산에서 중요한 역할을 합니다. 특히 행렬 곱셈은 벡터와 행렬 연산의 핵심입니다. 이번 포스팅에서는 Python의 NumPy 라이브러리를 사용하여 행렬 곱셈을 수행하는 방법에 대해 자세히 알아보겠습니다. NumPy는 빠르고 효율적인 수치 계산을 위해 설계된 강력한 라이브러리로, 행렬 연산을 간단하고 직관적으로 처리할 수 있도록 다양한 기능을 제공합니다.NumPy에서의 행렬 곱셈NumPy는 행렬 곱셈을 수행하기 위해 dot 함수와 matmul 함수를 제공합니다. 이 함수들은 다차원 배열 간의 내적 계산에 사용되며, 각각의 차이에 대해 이해하는 것이 중요합니다.행렬 곱셈의 기본 개념행렬 곱셈은 두 행렬의 원소..

Python/NumPy 2025.10.13

Pandas 그룹화(groupby()) 및 집계 함수(agg(), mean(), sum())

Pandas 그룹화(groupby()) 및 집계 함수(agg(), mean(), sum())데이터 분석에서 데이터를 그룹화하고 특정 연산을 적용하는 것은 매우 중요한 과정입니다. Pandas의 groupby() 메서드를 활용하면 데이터를 특정 기준에 따라 그룹화하고 다양한 집계 함수를 적용할 수 있습니다. 이번 포스팅에서는 groupby()의 기본 개념과 함께 agg(), mean(), sum() 등의 집계 함수를 활용하는 방법을 살펴보겠습니다.1. groupby()란?groupby()는 데이터프레임에서 특정 열의 값을 기준으로 데이터를 그룹화하는 기능을 제공합니다. 그룹화한 후에는 각 그룹별로 다양한 연산을 수행할 수 있습니다.groupby() 기본 사용법import pandas as pd# 샘플 데이..

Python/Pandas 2025.10.12

NumPy로 배우는 선형대수 기초

NumPy로 배우는 선형대수 기초안녕하세요, "소프트웨어 공장"에 오신 것을 환영합니다! 오늘은 파이썬의 강력한 데이터 처리 라이브러리인 NumPy를 활용하여 선형대수의 기초를 살펴보겠습니다. NumPy는 벡터, 행렬, 그리고 다양한 수학 연산을 간단하고 효율적으로 처리할 수 있어 데이터 분석과 머신러닝에 필수적인 도구입니다.이번 포스팅에서는 다음과 같은 내용을 다룹니다:선형대수와 NumPy의 관계벡터와 행렬의 생성기본 연산역행렬과 행렬식고유값과 고유벡터1. 선형대수와 NumPy의 관계선형대수는 데이터 과학과 인공지능에서 핵심적인 역할을 합니다. 머신러닝 알고리즘의 많은 부분이 선형대수에 기반을 두고 있으며, 벡터와 행렬을 다루는 작업이 빈번하게 발생합니다. NumPy는 이러한 작업을 효율적으로 수행하기..

Python/NumPy 2025.10.12

Pandas 다중 인덱스 사용 (set_index(), reset_index())

Pandas 다중 인덱스 사용 (set_index(), reset_index())Pandas에서 다중 인덱스를 사용하면 데이터를 계층적으로 정리하여 더욱 직관적으로 분석할 수 있습니다. 다중 인덱스는 set_index()를 사용하여 설정할 수 있으며, 필요할 때 reset_index()를 통해 일반 인덱스로 변환할 수도 있습니다. 이번 글에서는 다중 인덱스를 설정하고 활용하는 방법을 예제와 함께 살펴보겠습니다.1. 다중 인덱스란?Pandas의 다중 인덱스(MultiIndex)는 하나 이상의 열을 인덱스로 설정하여 데이터를 계층적으로 표현할 수 있는 기능입니다. 예를 들어, 지역별, 연도별 매출 데이터를 다룰 때 다중 인덱스를 활용하면 분석이 더욱 쉬워집니다.2. set_index()를 활용한 다중 인덱스..

Python/Pandas 2025.10.11

NumPy로 분포별 난수 생성하기

NumPy로 분포별 난수 생성하기NumPy는 파이썬의 강력한 수치 계산 라이브러리로, 데이터 분석과 과학 계산에서 널리 사용됩니다. 이 포스팅에서는 NumPy의 난수 생성 기능 중에서 분포별 난수 생성 방법에 대해 다루어 보겠습니다. 특히, 균등 분포 (Uniform Distribution)와 정규 분포 (Normal Distribution)를 중심으로 설명하고, 각 분포의 특성과 사용 방법을 예제와 함께 알아보겠습니다.NumPy 난수 생성 개요NumPy는 numpy.random 모듈을 통해 다양한 난수를 생성할 수 있습니다. numpy.random은 다음과 같은 기능을 제공합니다:균등 분포 (Uniform Distribution)정규 분포 (Normal Distribution)이항 분포 (Binomia..

Python/NumPy 2025.10.11
반응형