ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Python Pandas 기초: 데이터 분석의 시작
    pandas 2025. 1. 30. 22:19
    728x90

    Pandas란?

    Pandas는 Python에서 데이터를 효율적으로 처리하고 분석할 수 있도록 도와주는 라이브러리입니다. 행과 열로 구성된 DataFrameSeries 객체를 제공하여 엑셀이나 SQL과 유사한 방식으로 데이터를 다룰 수 있습니다.

    Pandas는 데이터 분석 및 머신러닝에서 필수적인 라이브러리로, 데이터를 정리하고 변환하는 데 매우 유용합니다.

    Pandas 설치하기

    Pandas를 사용하려면 먼저 라이브러리를 설치해야 합니다. 다음 명령어를 사용하면 쉽게 설치할 수 있습니다.

    pip install pandas

    설치 후에는 다음과 같이 라이브러리를 불러올 수 있습니다.

    import pandas as pd

    Pandas의 주요 데이터 구조

    Pandas에는 크게 두 가지 핵심 데이터 구조가 있습니다.

    1. Series: 1차원 데이터 구조 (엑셀의 한 열과 유사)
    2. DataFrame: 2차원 데이터 구조 (엑셀의 표와 유사)

    1. Series 생성하기

    import pandas as pd
    
    # 리스트로부터 Series 생성
    data = [10, 20, 30, 40, 50]
    series = pd.Series(data)
    print(series)

    출력 결과:

    0    10
    1    20
    2    30
    3    40
    4    50
    dtype: int64

    2. DataFrame 생성하기

    # 딕셔너리로부터 DataFrame 생성
    data = {
        '이름': ['홍길동', '이순신', '강감찬'],
        '나이': [25, 35, 45],
        '도시': ['서울', '부산', '대구']
    }
    df = pd.DataFrame(data)
    print(df)

    출력 결과:

        이름  나이  도시
    0  홍길동  25  서울
    1  이순신  35  부산
    2  강감찬  45  대구

    기본적인 데이터 조작

    1. 특정 열 선택

    print(df['이름'])

    2. 특정 행 선택

    print(df.loc[1])  # 행 번호로 선택
    print(df.iloc[1]) # 인덱스 위치로 선택

    3. 데이터 필터링

    print(df[df['나이'] > 30])

    마무리

    이번 포스팅에서는 Pandas의 기본 개념과 Series, DataFrame을 생성하는 방법을 알아보았습니다. 다음 포스팅에서는 데이터 불러오기 및 저장하기에 대해 다룰 예정이니 기대해주세요!

    728x90
Designed by Tistory.