728x90
반응형

Python/Pandas 27

Pandas에서 조건부 필터링 (Conditional Filtering)

Pandas에서 조건부 필터링 (Conditional Filtering)데이터 분석에서 특정 조건을 만족하는 데이터를 추출하는 작업은 매우 중요합니다. Pandas에서는 간단한 문법을 통해 조건을 기반으로 원하는 데이터를 필터링할 수 있습니다. 이번 포스팅에서는 df[df['column'] > value] 형태의 조건부 필터링 방법과 다양한 활용 예제를 살펴보겠습니다.1. 기본적인 조건부 필터링Pandas에서는 특정 열(column)의 값을 기준으로 데이터 프레임을 필터링할 수 있습니다. 가장 기본적인 방법은 아래와 같습니다.import pandas as pd# 예제 데이터 생성data = { '이름': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'], '나이':..

Python/Pandas 2025.10.10

Pandas에서 행과 열 선택: loc[], iloc[], at[], iat[]

Pandas에서 행과 열 선택: loc[], iloc[], at[], iat[]데이터 분석에서 특정 행과 열을 선택하는 것은 필수적인 과정입니다. Pandas에서는 loc[], iloc[], at[], iat[]을 제공하여 원하는 데이터를 효율적으로 선택할 수 있습니다. 이번 포스팅에서는 각 방법의 차이점을 예제와 함께 설명하겠습니다.1. 샘플 데이터 생성아래의 코드를 실행하여 샘플 DataFrame을 생성하겠습니다.import pandas as pd# 샘플 데이터 생성data = { "이름": ["김철수", "이영희", "박민준", "최다연", "정우성"], "나이": [25, 30, 22, 27, 35], "성별": ["남", "여", "남", "여", "남"], "점수": [9..

Python/Pandas 2025.10.09

Pandas 데이터 타입 변환 (astype()) - Pandas 데이터 변환과 가공

Pandas 데이터 타입 변환 (astype()) - Pandas 데이터 변환과 가공데이터 분석을 진행하다 보면 다양한 데이터 타입을 다뤄야 하며, 필요에 따라 데이터 타입을 변경해야 하는 경우가 많습니다. 예를 들어, 문자열로 저장된 숫자 데이터를 정수형으로 변환하거나, 실수형 데이터를 정수형으로 변환하는 등의 작업이 필요할 수 있습니다. Pandas의 astype() 메서드는 이러한 데이터 타입 변환을 간편하게 수행할 수 있도록 도와줍니다. 이번 포스팅에서는 astype()을 활용한 데이터 타입 변환 방법과 실전 예제를 살펴보겠습니다.1. astype() 메서드 개요Pandas의 astype() 메서드는 Series 또는 DataFrame의 데이터 타입을 원하는 타입으로 변환하는 데 사용됩니다. 기본..

Python/Pandas 2025.10.08

Pandas 날짜 데이터 처리 (to_datetime(), dt 속성 활용)

Pandas 날짜 데이터 처리 (to_datetime(), dt 속성 활용)데이터 분석을 수행할 때 날짜 데이터 처리는 필수적인 과정 중 하나입니다. Pandas는 to_datetime() 함수와 dt 속성을 제공하여 날짜 데이터를 효율적으로 변환하고 다룰 수 있도록 지원합니다. 이번 포스팅에서는 날짜 데이터를 처리하는 방법을 다양한 예제와 함께 알아보겠습니다.1. to_datetime()을 이용한 날짜 변환1.1 기본적인 날짜 변환Pandas의 to_datetime() 함수는 문자열이나 숫자로 저장된 날짜 데이터를 datetime 타입으로 변환하는 기능을 합니다.import pandas as pd# 문자열 날짜를 datetime으로 변환date_series = pd.Series(['2023-01-01'..

Python/Pandas 2025.10.07

Pandas에서 문자열 데이터 다루기: str.contains(), str.replace()

Pandas에서 문자열 데이터 다루기: str.contains(), str.replace()Pandas는 데이터 분석과 가공을 위한 강력한 라이브러리로, 특히 문자열 데이터를 효율적으로 다룰 수 있는 다양한 기능을 제공합니다. 본 포스팅에서는 str.contains()와 str.replace()를 활용하여 문자열 데이터를 필터링하고 변환하는 방법을 살펴보겠습니다.1. str.contains()를 활용한 문자열 필터링str.contains() 메서드는 특정 문자열이나 패턴이 포함된 데이터를 필터링하는 데 유용합니다. 이는 정규 표현식(Regular Expression)과 함께 사용할 수도 있어 강력한 검색 기능을 제공합니다.사용법Series.str.contains(pat, case=True, na=np.n..

Python/Pandas 2025.10.06

Pandas 컬럼 추가, 삭제 및 데이터 수정하기

Pandas 컬럼 추가, 삭제 및 데이터 수정하기Pandas는 데이터 분석을 위한 강력한 라이브러리로, 데이터 변환과 가공을 쉽게 수행할 수 있습니다. 이번 포스팅에서는 assign(), drop(), rename()을 활용하여 컬럼을 추가하고 삭제하며 이름을 변경하는 방법을 살펴보겠습니다.1. 컬럼 추가하기: assign()Pandas의 assign() 메서드는 새로운 컬럼을 추가하거나 기존 컬럼을 수정하는 데 사용됩니다. 이 메서드는 원본 DataFrame을 변경하지 않고 새로운 DataFrame을 반환하는 방식으로 동작합니다.예제: 새로운 컬럼 추가하기import pandas as pd# 샘플 데이터 생성data = { '이름': ['김철수', '이영희', '박민수'], '국어': [90..

Python/Pandas 2025.10.05

Pandas 데이터 정렬 및 필터링 (sort_values(), query())

Pandas 데이터 정렬 및 필터링 (sort_values(), query())데이터 분석에서 데이터를 정리하는 과정은 매우 중요합니다. 데이터가 정렬되어 있어야 패턴을 찾기 쉽고, 원하는 데이터를 빠르게 추출할 수 있습니다. Pandas에서는 sort_values()를 사용하여 데이터를 정렬하고, query()를 활용하여 원하는 조건의 데이터를 필터링할 수 있습니다. 이번 포스팅에서는 이 두 가지 기능을 중심으로 데이터 정렬과 필터링 방법을 자세히 살펴보겠습니다.1. 데이터 정렬 (sort_values())Pandas의 sort_values() 메서드는 DataFrame의 특정 열을 기준으로 데이터를 정렬할 때 사용됩니다. 기본적으로 오름차순 정렬을 수행하며, 내림차순 정렬도 가능합니다.기본 사용법im..

Python/Pandas 2025.10.04

Pandas 중복 데이터 제거 (drop_duplicates())

Pandas 중복 데이터 제거 (drop_duplicates())데이터 분석을 수행하다 보면 중복된 데이터를 처리해야 하는 경우가 많습니다. 예를 들어, 웹 크롤링을 통해 데이터를 수집하거나 여러 데이터셋을 병합하는 과정에서 동일한 행이 여러 번 포함될 수 있습니다. Pandas에서는 drop_duplicates() 메서드를 사용하여 간단하게 중복 데이터를 제거할 수 있습니다. 이번 포스팅에서는 drop_duplicates()의 기본 사용법과 다양한 활용법을 알아보겠습니다.1. drop_duplicates() 기본 사용법drop_duplicates() 메서드는 기본적으로 DataFrame에서 완전히 동일한 행이 중복되었을 때 첫 번째 행을 유지하고 나머지 중복된 행을 제거합니다.예제 데이터 생성먼저 중복..

Python/Pandas 2025.10.03

Pandas 결측치 처리 (isna(), fillna(), dropna())

Pandas 결측치 처리 (isna(), fillna(), dropna())데이터 분석을 수행할 때 결측치는 흔히 발생하는 문제입니다. Pandas에서는 isna(), fillna(), dropna() 등의 함수를 활용하여 결측치를 탐색하고 적절히 처리할 수 있습니다. 이번 포스팅에서는 이러한 함수를 사용하여 결측치를 다루는 방법을 예제와 함께 살펴보겠습니다.1. 결측치란?결측치(Missing Value)는 데이터셋에서 누락된 값을 의미합니다. 결측치는 여러 가지 이유로 발생할 수 있으며, 결측치를 적절히 처리하지 않으면 데이터 분석 결과에 부정적인 영향을 미칠 수 있습니다. Pandas에서는 NaN(Not a Number) 값을 통해 결측치를 표현합니다.2. 결측치 탐색 (isna(), isnull()..

Python/Pandas 2025.10.02

Pandas 데이터 미리보기: head(), tail(), info(), describe()

Pandas 데이터 미리보기: head(), tail(), info(), describe()데이터 분석을 시작할 때 가장 먼저 해야 할 일은 데이터의 구조와 내용을 파악하는 것입니다. Pandas 라이브러리는 데이터프레임을 탐색하고 정리하는 데 유용한 다양한 함수를 제공합니다. 이번 포스팅에서는 head(), tail(), info(), describe() 함수의 사용법과 활용 방법을 살펴보겠습니다.1. head(): 데이터의 일부 미리보기head() 함수는 데이터프레임의 처음 몇 개의 행을 출력합니다. 기본적으로 5개 행을 반환하지만, 원하는 개수를 지정할 수도 있습니다.예제 코드import pandas as pd# 샘플 데이터 생성data = { '이름': ['홍길동', '김철수', '이영희',..

Python/Pandas 2025.10.01
반응형