반응형

분류 전체보기 978

Pandas 결측치 처리 (isna(), fillna(), dropna())

Pandas 결측치 처리 (isna(), fillna(), dropna())데이터 분석을 수행할 때 결측치는 흔히 발생하는 문제입니다. Pandas에서는 isna(), fillna(), dropna() 등의 함수를 활용하여 결측치를 탐색하고 적절히 처리할 수 있습니다. 이번 포스팅에서는 이러한 함수를 사용하여 결측치를 다루는 방법을 예제와 함께 살펴보겠습니다.1. 결측치란?결측치(Missing Value)는 데이터셋에서 누락된 값을 의미합니다. 결측치는 여러 가지 이유로 발생할 수 있으며, 결측치를 적절히 처리하지 않으면 데이터 분석 결과에 부정적인 영향을 미칠 수 있습니다. Pandas에서는 NaN(Not a Number) 값을 통해 결측치를 표현합니다.2. 결측치 탐색 (isna(), isnull()..

Python/Pandas 2025.10.02

NumPy 유니버설 함수 (Universal Functions, ufunc) 알아보기

NumPy 유니버설 함수 (Universal Functions, ufunc) 알아보기안녕하세요! 오늘은 "소프트웨어 공장"에서 NumPy의 강력한 기능 중 하나인 유니버설 함수(Universal Functions, 줄여서 ufunc)에 대해 알아보겠습니다. ufunc는 고성능의 벡터화 연산을 제공하며, NumPy 배열에서 매우 빠르고 효율적인 계산을 가능하게 해줍니다. 본 포스팅에서는 ufunc의 개념, 주요 특징, 활용 사례 및 몇 가지 자주 사용하는 ufunc에 대해 예제와 함께 알아보겠습니다.유니버설 함수란 무엇인가?유니버설 함수는 NumPy에서 제공하는 함수로, 배열의 각 요소에 대해 반복적인 계산을 수행합니다. 일반적인 Python 루프를 사용하는 것보다 훨씬 빠르게 계산을 수행할 수 있습니다...

Python/NumPy 2025.10.02

Pandas 데이터 미리보기: head(), tail(), info(), describe()

Pandas 데이터 미리보기: head(), tail(), info(), describe()데이터 분석을 시작할 때 가장 먼저 해야 할 일은 데이터의 구조와 내용을 파악하는 것입니다. Pandas 라이브러리는 데이터프레임을 탐색하고 정리하는 데 유용한 다양한 함수를 제공합니다. 이번 포스팅에서는 head(), tail(), info(), describe() 함수의 사용법과 활용 방법을 살펴보겠습니다.1. head(): 데이터의 일부 미리보기head() 함수는 데이터프레임의 처음 몇 개의 행을 출력합니다. 기본적으로 5개 행을 반환하지만, 원하는 개수를 지정할 수도 있습니다.예제 코드import pandas as pd# 샘플 데이터 생성data = { '이름': ['홍길동', '김철수', '이영희',..

Python/Pandas 2025.10.01

NumPy 배열 브로드캐스팅 (Broadcasting)

NumPy 배열 브로드캐스팅 (Broadcasting)NumPy는 Python에서 강력한 배열 처리 기능을 제공하는 라이브러리로, 과학 계산 및 데이터 분석에 널리 사용되고 있습니다. NumPy의 주요 기능 중 하나는 브로드캐스팅(Broadcasting)입니다. 브로드캐스팅은 크기가 다른 배열 간에 연산을 수행할 때 유용하게 사용됩니다. 이번 포스팅에서는 브로드캐스팅의 개념과 활용 방법을 자세히 알아보겠습니다.1. 브로드캐스팅이란?브로드캐스팅은 NumPy에서 서로 다른 크기의 배열 간에 연산을 수행할 수 있도록 배열을 자동으로 확장하는 기능입니다. 예를 들어, 배열의 크기가 동일하지 않아도 NumPy는 내부적으로 더 작은 배열의 크기를 확장하여 연산을 수행합니다.브로드캐스팅 규칙두 배열의 축(axis)의..

Python/NumPy 2025.10.01

웹에서 데이터 불러오기 (Pandas)

웹에서 데이터 불러오기 (Pandas)데이터 분석을 수행할 때, 웹에서 데이터를 직접 불러오는 것은 매우 유용한 기능입니다. Pandas는 웹에서 데이터를 가져와 DataFrame으로 변환하는 다양한 방법을 제공합니다. 이번 포스팅에서는 웹 데이터를 불러오는 방법과 이를 활용하는 실전 예제를 다룹니다.1. 웹에서 데이터 불러오는 방법Pandas에서는 웹에서 데이터를 불러올 수 있는 여러 함수들을 제공합니다. 가장 많이 사용되는 방법은 read_html(), read_csv() 및 read_json()을 활용하는 것입니다.1.1 read_html(): HTML 테이블 가져오기웹페이지에는 종종 표 형식의 데이터가 포함되어 있습니다. Pandas의 read_html() 함수를 사용하면 HTML 페이지에서 테이..

Python/Pandas 2025.09.30

NumPy Array 기본 산술 연산

NumPy Array 기본 산술 연산NumPy는 Python에서 수치 연산을 수행하는 데 필수적인 라이브러리로, 대규모 다차원 배열과 행렬 연산을 효율적으로 처리할 수 있습니다. 오늘은 NumPy Array의 기본 산술 연산에 대해 알아보겠습니다. 덧셈, 뺄셈, 곱셈, 나눗셈과 같은 기본 연산을 다양한 예제와 함께 살펴보겠습니다.1. NumPy 배열 생성하기우선, 산술 연산을 수행할 배열을 생성해 보겠습니다. NumPy 배열은 numpy.array() 함수를 사용하여 생성할 수 있습니다.import numpy as np# 배열 생성array1 = np.array([1, 2, 3, 4])array2 = np.array([5, 6, 7, 8])print("Array 1:", array1)print("Arra..

Python/NumPy 2025.09.30

Pandas SQL 파일 포맷 다루기

Pandas SQL 파일 포맷 다루기Python의 pandas 라이브러리는 다양한 데이터 포맷을 지원하며, 특히 SQL 데이터베이스와의 연동이 강력한 기능 중 하나입니다. 데이터 분석 과정에서 관계형 데이터베이스에 저장된 데이터를 불러오거나 가공한 후 다시 저장하는 일이 빈번하게 발생합니다. 이번 포스팅에서는 pandas를 이용해 SQL 데이터베이스의 데이터를 로드하고 저장하는 방법을 살펴보겠습니다.1. SQLite와 pandas 연동SQL 데이터베이스 중에서도 SQLite는 가벼운 파일 기반 데이터베이스로, 별도의 서버 설정 없이 사용할 수 있습니다. pandas는 SQLite와의 연동을 기본적으로 지원하며, sqlite3 또는 SQLAlchemy를 활용하여 연결할 수 있습니다.1.1 SQLite 데이..

Python/Pandas 2025.09.29

NumPy 슬라이싱 및 배열의 복사와 뷰

NumPy 슬라이싱 및 배열의 복사와 뷰안녕하세요! "소프트웨어 공장"에 오신 것을 환영합니다. 오늘은 Python의 강력한 라이브러리인 NumPy에서 배열의 슬라이싱(slicing)과 복사(copy), 그리고 뷰(view)에 대해 자세히 알아보겠습니다. 이 주제는 NumPy를 효율적으로 활용하기 위해 반드시 알아야 하는 핵심 개념입니다. 다양한 예제와 함께 설명하니 끝까지 읽어주세요!1. NumPy 배열의 슬라이싱NumPy 배열에서 슬라이싱은 특정 부분을 선택하는 데 사용됩니다. 슬라이싱 구문은 Python 리스트의 슬라이싱과 비슷하지만, 다차원 배열에서도 간단하고 강력하게 사용할 수 있다는 점에서 차별화됩니다.기본 구문array[start:stop:step]start: 시작 인덱스 (포함)stop: ..

Python/NumPy 2025.09.29

JSON 파일 포맷 다루기

JSON 파일 포맷 다루기JSON(JavaScript Object Notation)은 데이터를 구조화하여 저장하는 대표적인 포맷 중 하나입니다. Pandas는 JSON 데이터를 효율적으로 다룰 수 있는 다양한 기능을 제공합니다. 이번 포스팅에서는 JSON 파일을 Pandas에서 로드하고 저장하는 방법을 상세히 알아보겠습니다.1. JSON 파일이란?JSON은 키-값 쌍으로 이루어진 경량 데이터 교환 형식으로, 사람이 읽고 쓰기 쉽고 기계가 파싱하고 생성하기 용이한 특징을 가집니다. 주로 웹 서비스에서 데이터를 주고받을 때 사용됩니다.JSON 데이터의 예시는 다음과 같습니다:{ "name": "Alice", "age": 25, "city": "New York"}또한, JSON은 리스트 형식의..

Python/Pandas 2025.09.28

NumPy 배열의 인덱싱 이해하기

NumPy 배열의 인덱싱 이해하기NumPy는 Python에서 강력한 수치 계산 기능을 제공하는 라이브러리로, 데이터 분석과 과학 계산에서 매우 유용하게 사용됩니다. 오늘은 NumPy에서 1차원, 2차원, 다차원 배열의 인덱싱에 대해 자세히 알아보겠습니다. 각각의 경우를 이해하기 위해 실습 예제도 함께 제공하니, 코드를 직접 실행하며 학습해 보세요.1. 1차원 배열의 인덱싱1차원 배열은 Python의 리스트와 유사한 구조를 가지고 있습니다. 배열의 각 요소는 인덱스를 사용하여 접근할 수 있습니다.1.1 기본 인덱싱import numpy as np# 1차원 배열 생성arr = np.array([10, 20, 30, 40, 50])# 특정 요소에 접근print(arr[0]) # 출력: 10print(arr[..

Python/NumPy 2025.09.28
반응형