반응형

분류 전체보기 968

Pandas 날짜 데이터 처리 (to_datetime(), dt 속성 활용)

Pandas 날짜 데이터 처리 (to_datetime(), dt 속성 활용)데이터 분석을 수행할 때 날짜 데이터 처리는 필수적인 과정 중 하나입니다. Pandas는 to_datetime() 함수와 dt 속성을 제공하여 날짜 데이터를 효율적으로 변환하고 다룰 수 있도록 지원합니다. 이번 포스팅에서는 날짜 데이터를 처리하는 방법을 다양한 예제와 함께 알아보겠습니다.1. to_datetime()을 이용한 날짜 변환1.1 기본적인 날짜 변환Pandas의 to_datetime() 함수는 문자열이나 숫자로 저장된 날짜 데이터를 datetime 타입으로 변환하는 기능을 합니다.import pandas as pd# 문자열 날짜를 datetime으로 변환date_series = pd.Series(['2023-01-01'..

Python/Pandas 2025.10.07

NumPy를 활용한 수학적 함수 적용

NumPy를 활용한 수학적 함수 적용NumPy는 파이썬에서 가장 강력하고 널리 사용되는 과학 계산 라이브러리로, 대규모 다차원 배열과 행렬 연산을 효율적으로 처리할 수 있도록 설계되었습니다. NumPy는 다양한 수학적 함수와 통계적 기능을 제공하며, 오늘은 그중에서 수학적 함수(sin, cos, exp, log 등)를 사용하는 방법에 대해 알아보겠습니다.NumPy의 수학적 함수 소개NumPy는 벡터화된 수학 연산을 통해 빠르고 간단하게 배열의 요소에 함수 적용을 가능하게 합니다. 기본적으로 NumPy는 다음과 같은 주요 수학적 함수들을 지원합니다:삼각 함수: sin, cos, tan지수 함수: exp로그 함수: log, log10, log2기타 함수: sqrt, abs, ceil, floor이 함수들은 ..

Python/NumPy 2025.10.07

Pandas에서 문자열 데이터 다루기: str.contains(), str.replace()

Pandas에서 문자열 데이터 다루기: str.contains(), str.replace()Pandas는 데이터 분석과 가공을 위한 강력한 라이브러리로, 특히 문자열 데이터를 효율적으로 다룰 수 있는 다양한 기능을 제공합니다. 본 포스팅에서는 str.contains()와 str.replace()를 활용하여 문자열 데이터를 필터링하고 변환하는 방법을 살펴보겠습니다.1. str.contains()를 활용한 문자열 필터링str.contains() 메서드는 특정 문자열이나 패턴이 포함된 데이터를 필터링하는 데 유용합니다. 이는 정규 표현식(Regular Expression)과 함께 사용할 수도 있어 강력한 검색 기능을 제공합니다.사용법Series.str.contains(pat, case=True, na=np.n..

Python/Pandas 2025.10.06

NumPy를 활용한 통계 계산: mean, median, std, var 등

NumPy를 활용한 통계 계산: mean, median, std, var 등NumPy는 데이터 분석과 과학 계산에 필수적인 Python 라이브러리로, 특히 대규모 데이터 처리와 배열 기반의 계산에서 강력한 기능을 제공합니다. 오늘은 NumPy의 주요 통계 및 수학 함수인 mean, median, std, var 등을 중심으로 간단한 예제와 함께 알아보겠습니다.1. NumPy 통계 함수 소개NumPy는 다양한 통계 함수를 제공합니다. 이 함수들은 데이터의 중심 경향성과 변동성을 분석하는 데 유용합니다.주요 함수 설명mean: 데이터의 평균값을 계산합니다.median: 데이터의 중앙값을 계산합니다.std: 데이터의 표준 편차를 계산합니다.var: 데이터의 분산을 계산합니다.각 함수는 다차원 배열에 대해 축(..

Python/NumPy 2025.10.06

Pandas 컬럼 추가, 삭제 및 데이터 수정하기

Pandas 컬럼 추가, 삭제 및 데이터 수정하기Pandas는 데이터 분석을 위한 강력한 라이브러리로, 데이터 변환과 가공을 쉽게 수행할 수 있습니다. 이번 포스팅에서는 assign(), drop(), rename()을 활용하여 컬럼을 추가하고 삭제하며 이름을 변경하는 방법을 살펴보겠습니다.1. 컬럼 추가하기: assign()Pandas의 assign() 메서드는 새로운 컬럼을 추가하거나 기존 컬럼을 수정하는 데 사용됩니다. 이 메서드는 원본 DataFrame을 변경하지 않고 새로운 DataFrame을 반환하는 방식으로 동작합니다.예제: 새로운 컬럼 추가하기import pandas as pd# 샘플 데이터 생성data = { '이름': ['김철수', '이영희', '박민수'], '국어': [90..

Python/Pandas 2025.10.05

NumPy 배열의 반복 및 타일링 (tile, repeat)

NumPy 배열의 반복 및 타일링 (tile, repeat)NumPy는 파이썬에서 과학 계산을 위해 널리 사용되는 라이브러리로, 고성능 다차원 배열 객체를 제공합니다. 오늘은 NumPy에서 배열을 반복하거나 타일링하여 데이터를 확장하는 데 사용되는 tile과 repeat 함수에 대해 알아보겠습니다.1. tile 함수란?tile 함수는 배열을 지정된 패턴으로 반복하여 새로운 배열을 생성합니다. 타일링은 원래 배열을 마치 타일처럼 여러 번 복사하여 배치하는 방식입니다.문법numpy.tile(A, reps)A: 입력 배열reps: 각 축(axis)별로 반복할 횟수를 지정한 정수 또는 정수의 튜플예제 1: 1차원 배열 타일링import numpy as nparr = np.array([1, 2, 3])result..

Python/NumPy 2025.10.05

Pandas 데이터 정렬 및 필터링 (sort_values(), query())

Pandas 데이터 정렬 및 필터링 (sort_values(), query())데이터 분석에서 데이터를 정리하는 과정은 매우 중요합니다. 데이터가 정렬되어 있어야 패턴을 찾기 쉽고, 원하는 데이터를 빠르게 추출할 수 있습니다. Pandas에서는 sort_values()를 사용하여 데이터를 정렬하고, query()를 활용하여 원하는 조건의 데이터를 필터링할 수 있습니다. 이번 포스팅에서는 이 두 가지 기능을 중심으로 데이터 정렬과 필터링 방법을 자세히 살펴보겠습니다.1. 데이터 정렬 (sort_values())Pandas의 sort_values() 메서드는 DataFrame의 특정 열을 기준으로 데이터를 정렬할 때 사용됩니다. 기본적으로 오름차순 정렬을 수행하며, 내림차순 정렬도 가능합니다.기본 사용법im..

Python/Pandas 2025.10.04

NumPy 배열의 연결과 분리 (concatenate, split)

NumPy 배열의 연결과 분리 (concatenate, split)안녕하세요! 오늘은 Python의 강력한 데이터 처리 라이브러리인 NumPy에서 배열을 연결하고 분리하는 방법에 대해 알아보겠습니다. 데이터 분석과 과학 계산에서 데이터를 다루다 보면 여러 배열을 합치거나 쪼개야 할 일이 자주 발생합니다. NumPy는 이러한 작업을 효율적으로 수행할 수 있는 다양한 함수를 제공합니다.1. 배열 연결 (Concatenate)NumPy에서는 numpy.concatenate 함수를 사용하여 배열을 연결할 수 있습니다. 이 함수는 주어진 축(axis)을 기준으로 두 개 이상의 배열을 이어 붙입니다.numpy.concatenate 함수 사용법numpy.concatenate((arr1, arr2, ...), axis..

Python/NumPy 2025.10.04

Pandas 중복 데이터 제거 (drop_duplicates())

Pandas 중복 데이터 제거 (drop_duplicates())데이터 분석을 수행하다 보면 중복된 데이터를 처리해야 하는 경우가 많습니다. 예를 들어, 웹 크롤링을 통해 데이터를 수집하거나 여러 데이터셋을 병합하는 과정에서 동일한 행이 여러 번 포함될 수 있습니다. Pandas에서는 drop_duplicates() 메서드를 사용하여 간단하게 중복 데이터를 제거할 수 있습니다. 이번 포스팅에서는 drop_duplicates()의 기본 사용법과 다양한 활용법을 알아보겠습니다.1. drop_duplicates() 기본 사용법drop_duplicates() 메서드는 기본적으로 DataFrame에서 완전히 동일한 행이 중복되었을 때 첫 번째 행을 유지하고 나머지 중복된 행을 제거합니다.예제 데이터 생성먼저 중복..

Python/Pandas 2025.10.03

NumPy 배열의 형태 변경: reshape, ravel, flatten

NumPy 배열의 형태 변경: reshape, ravel, flattenNumPy는 과학 계산과 데이터 분석에 널리 사용되는 Python 라이브러리로, 다차원 배열 처리가 주된 특징입니다. 이번 포스팅에서는 NumPy 배열의 형태를 변경하는 다양한 방법에 대해 알아보겠습니다. 특히 reshape, ravel, flatten에 대해 자세히 살펴보고, 각 메서드의 사용법과 차이점을 예제와 함께 설명하겠습니다.1. 배열의 형태 변경이란?NumPy 배열은 데이터를 다차원 구조로 저장할 수 있습니다. 때로는 데이터를 처리하기 위해 배열의 형태를 변경해야 할 필요가 있습니다. 이를 위해 NumPy는 reshape, ravel, flatten 등 다양한 메서드를 제공합니다.주요 메서드 소개reshape: 배열의 형태..

Python/NumPy 2025.10.03
반응형