728x90
반응형

2025/09 57

웹에서 데이터 불러오기 (Pandas)

웹에서 데이터 불러오기 (Pandas)데이터 분석을 수행할 때, 웹에서 데이터를 직접 불러오는 것은 매우 유용한 기능입니다. Pandas는 웹에서 데이터를 가져와 DataFrame으로 변환하는 다양한 방법을 제공합니다. 이번 포스팅에서는 웹 데이터를 불러오는 방법과 이를 활용하는 실전 예제를 다룹니다.1. 웹에서 데이터 불러오는 방법Pandas에서는 웹에서 데이터를 불러올 수 있는 여러 함수들을 제공합니다. 가장 많이 사용되는 방법은 read_html(), read_csv() 및 read_json()을 활용하는 것입니다.1.1 read_html(): HTML 테이블 가져오기웹페이지에는 종종 표 형식의 데이터가 포함되어 있습니다. Pandas의 read_html() 함수를 사용하면 HTML 페이지에서 테이..

Python/Pandas 2025.09.30

NumPy Array 기본 산술 연산

NumPy Array 기본 산술 연산NumPy는 Python에서 수치 연산을 수행하는 데 필수적인 라이브러리로, 대규모 다차원 배열과 행렬 연산을 효율적으로 처리할 수 있습니다. 오늘은 NumPy Array의 기본 산술 연산에 대해 알아보겠습니다. 덧셈, 뺄셈, 곱셈, 나눗셈과 같은 기본 연산을 다양한 예제와 함께 살펴보겠습니다.1. NumPy 배열 생성하기우선, 산술 연산을 수행할 배열을 생성해 보겠습니다. NumPy 배열은 numpy.array() 함수를 사용하여 생성할 수 있습니다.import numpy as np# 배열 생성array1 = np.array([1, 2, 3, 4])array2 = np.array([5, 6, 7, 8])print("Array 1:", array1)print("Arra..

Python/NumPy 2025.09.30

Pandas SQL 파일 포맷 다루기

Pandas SQL 파일 포맷 다루기Python의 pandas 라이브러리는 다양한 데이터 포맷을 지원하며, 특히 SQL 데이터베이스와의 연동이 강력한 기능 중 하나입니다. 데이터 분석 과정에서 관계형 데이터베이스에 저장된 데이터를 불러오거나 가공한 후 다시 저장하는 일이 빈번하게 발생합니다. 이번 포스팅에서는 pandas를 이용해 SQL 데이터베이스의 데이터를 로드하고 저장하는 방법을 살펴보겠습니다.1. SQLite와 pandas 연동SQL 데이터베이스 중에서도 SQLite는 가벼운 파일 기반 데이터베이스로, 별도의 서버 설정 없이 사용할 수 있습니다. pandas는 SQLite와의 연동을 기본적으로 지원하며, sqlite3 또는 SQLAlchemy를 활용하여 연결할 수 있습니다.1.1 SQLite 데이..

Python/Pandas 2025.09.29

NumPy 슬라이싱 및 배열의 복사와 뷰

NumPy 슬라이싱 및 배열의 복사와 뷰안녕하세요! "소프트웨어 공장"에 오신 것을 환영합니다. 오늘은 Python의 강력한 라이브러리인 NumPy에서 배열의 슬라이싱(slicing)과 복사(copy), 그리고 뷰(view)에 대해 자세히 알아보겠습니다. 이 주제는 NumPy를 효율적으로 활용하기 위해 반드시 알아야 하는 핵심 개념입니다. 다양한 예제와 함께 설명하니 끝까지 읽어주세요!1. NumPy 배열의 슬라이싱NumPy 배열에서 슬라이싱은 특정 부분을 선택하는 데 사용됩니다. 슬라이싱 구문은 Python 리스트의 슬라이싱과 비슷하지만, 다차원 배열에서도 간단하고 강력하게 사용할 수 있다는 점에서 차별화됩니다.기본 구문array[start:stop:step]start: 시작 인덱스 (포함)stop: ..

Python/NumPy 2025.09.29

JSON 파일 포맷 다루기

JSON 파일 포맷 다루기JSON(JavaScript Object Notation)은 데이터를 구조화하여 저장하는 대표적인 포맷 중 하나입니다. Pandas는 JSON 데이터를 효율적으로 다룰 수 있는 다양한 기능을 제공합니다. 이번 포스팅에서는 JSON 파일을 Pandas에서 로드하고 저장하는 방법을 상세히 알아보겠습니다.1. JSON 파일이란?JSON은 키-값 쌍으로 이루어진 경량 데이터 교환 형식으로, 사람이 읽고 쓰기 쉽고 기계가 파싱하고 생성하기 용이한 특징을 가집니다. 주로 웹 서비스에서 데이터를 주고받을 때 사용됩니다.JSON 데이터의 예시는 다음과 같습니다:{ "name": "Alice", "age": 25, "city": "New York"}또한, JSON은 리스트 형식의..

Python/Pandas 2025.09.28

NumPy 배열의 인덱싱 이해하기

NumPy 배열의 인덱싱 이해하기NumPy는 Python에서 강력한 수치 계산 기능을 제공하는 라이브러리로, 데이터 분석과 과학 계산에서 매우 유용하게 사용됩니다. 오늘은 NumPy에서 1차원, 2차원, 다차원 배열의 인덱싱에 대해 자세히 알아보겠습니다. 각각의 경우를 이해하기 위해 실습 예제도 함께 제공하니, 코드를 직접 실행하며 학습해 보세요.1. 1차원 배열의 인덱싱1차원 배열은 Python의 리스트와 유사한 구조를 가지고 있습니다. 배열의 각 요소는 인덱스를 사용하여 접근할 수 있습니다.1.1 기본 인덱싱import numpy as np# 1차원 배열 생성arr = np.array([10, 20, 30, 40, 50])# 특정 요소에 접근print(arr[0]) # 출력: 10print(arr[..

Python/NumPy 2025.09.28

Pandas로 Excel 파일 다루기

Pandas로 Excel 파일 다루기1. 개요Excel은 데이터 분석에서 자주 사용되는 포맷 중 하나입니다. Pandas는 read_excel과 to_excel을 제공하여 Excel 파일을 쉽게 읽고 저장할 수 있도록 지원합니다. 이번 포스팅에서는 Pandas를 활용하여 Excel 파일을 다루는 방법을 실습과 함께 알아보겠습니다.2. Excel 파일 읽기 (read_excel)Pandas에서 Excel 파일을 읽기 위해 read_excel() 함수를 사용합니다. 먼저 Pandas와 openpyxl을 설치해야 합니다.pip install pandas openpyxl이제 샘플 Excel 파일을 읽어 보겠습니다.import pandas as pd# Excel 파일 읽기df = pd.read_excel("sam..

Python/Pandas 2025.09.27

NumPy 배열의 데이터 타입 이해하기

NumPy 배열의 데이터 타입 이해하기NumPy는 Python에서 과학 계산을 수행할 때 가장 널리 사용되는 라이브러리 중 하나입니다. 특히, 다차원 배열 객체인 ndarray를 제공하여 대규모 데이터를 효율적으로 처리할 수 있습니다. 오늘은 NumPy 배열의 핵심 개념 중 하나인 데이터 타입(data type)에 대해 알아보겠습니다. 이 글에서는 데이터 타입의 개념, 주요 데이터 타입의 종류, 그리고 데이터 타입을 다루는 방법에 대해 설명합니다.데이터 타입이란?NumPy 배열의 데이터 타입은 배열에 저장되는 요소의 종류를 정의합니다. NumPy는 고성능 계산을 위해 배열 내의 모든 요소가 동일한 데이터 타입을 가지도록 설계되었습니다. 데이터 타입은 메모리에서 데이터를 저장하는 방식을 정의하며, 이는 효..

Python/NumPy 2025.09.27

Pandas로 CSV 파일 다루기

Pandas로 CSV 파일 다루기데이터 분석에서 CSV(Comma-Separated Values) 파일은 가장 널리 사용되는 포맷 중 하나입니다. Pandas를 활용하면 CSV 파일을 손쉽게 읽고, 수정하고, 저장할 수 있습니다. 이번 포스팅에서는 Pandas로 CSV 파일을 다루는 방법에 대해 자세히 알아보겠습니다.1. CSV 파일이란?CSV 파일은 각 행이 쉼표(,)로 구분된 텍스트 파일로, 간단하면서도 데이터 저장 및 교환에 많이 활용됩니다. Excel, 데이터베이스, 웹 애플리케이션 등 다양한 환경에서 사용됩니다.CSV 파일의 예시는 다음과 같습니다:name,age,cityAlice,25,New YorkBob,30,Los AngelesCharlie,35,Chicago이제 Pandas를 이용해 CS..

Python/Pandas 2025.09.26

NumPy 배열의 속성 확인하기

NumPy 배열의 속성 확인하기안녕하세요! 오늘은 NumPy 배열의 중요한 속성들을 확인하는 방법에 대해 알아보겠습니다. NumPy는 Python에서 과학 계산을 수행할 때 가장 널리 사용되는 라이브러리 중 하나로, 특히 배열 데이터 처리를 강력하게 지원합니다. NumPy 배열의 속성들을 이해하면 데이터 구조와 배열 연산에 대한 통찰을 얻을 수 있습니다.NumPy 배열의 주요 속성NumPy 배열의 속성은 배열의 구조와 데이터를 설명하는 중요한 정보들을 제공합니다. 이 포스팅에서는 다음 속성들을 다룹니다:shapendimsizedtypeitemsizenbytesT (전치 행렬)이제 각 속성을 하나씩 살펴보고, 예제 코드를 통해 활용 방법을 알아보겠습니다.1. 배열의 shapeshape 속성은 배열의 차원별..

Python/NumPy 2025.09.26
728x90
반응형