-
Python Pandas 기초: 데이터 분석의 시작pandas 2025. 1. 30. 22:19728x90
Pandas란?
Pandas는 Python에서 데이터를 효율적으로 처리하고 분석할 수 있도록 도와주는 라이브러리입니다. 행과 열로 구성된 DataFrame과 Series 객체를 제공하여 엑셀이나 SQL과 유사한 방식으로 데이터를 다룰 수 있습니다.
Pandas는 데이터 분석 및 머신러닝에서 필수적인 라이브러리로, 데이터를 정리하고 변환하는 데 매우 유용합니다.
Pandas 설치하기
Pandas를 사용하려면 먼저 라이브러리를 설치해야 합니다. 다음 명령어를 사용하면 쉽게 설치할 수 있습니다.
pip install pandas
설치 후에는 다음과 같이 라이브러리를 불러올 수 있습니다.
import pandas as pd
Pandas의 주요 데이터 구조
Pandas에는 크게 두 가지 핵심 데이터 구조가 있습니다.
- Series: 1차원 데이터 구조 (엑셀의 한 열과 유사)
- DataFrame: 2차원 데이터 구조 (엑셀의 표와 유사)
1. Series 생성하기
import pandas as pd # 리스트로부터 Series 생성 data = [10, 20, 30, 40, 50] series = pd.Series(data) print(series)
출력 결과:
0 10 1 20 2 30 3 40 4 50 dtype: int64
2. DataFrame 생성하기
# 딕셔너리로부터 DataFrame 생성 data = { '이름': ['홍길동', '이순신', '강감찬'], '나이': [25, 35, 45], '도시': ['서울', '부산', '대구'] } df = pd.DataFrame(data) print(df)
출력 결과:
이름 나이 도시 0 홍길동 25 서울 1 이순신 35 부산 2 강감찬 45 대구
기본적인 데이터 조작
1. 특정 열 선택
print(df['이름'])
2. 특정 행 선택
print(df.loc[1]) # 행 번호로 선택 print(df.iloc[1]) # 인덱스 위치로 선택
3. 데이터 필터링
print(df[df['나이'] > 30])
마무리
이번 포스팅에서는 Pandas의 기본 개념과 Series, DataFrame을 생성하는 방법을 알아보았습니다. 다음 포스팅에서는 데이터 불러오기 및 저장하기에 대해 다룰 예정이니 기대해주세요!
728x90'pandas' 카테고리의 다른 글
Pandas와 Scikit-Learn을 활용한 머신러닝 모델 만들기 (0) 2025.01.30 Pandas를 활용한 실전 데이터 분석 예제 (0) 2025.01.30 Pandas를 활용한 데이터 분석 및 시각화 (0) 2025.01.30 Pandas를 활용한 데이터 전처리 및 정리 (0) 2025.01.30 Pandas로 데이터 불러오기 및 저장하기 (0) 2025.01.30