pandas data preprocessing
-
Pandas를 활용한 데이터 전처리 및 정리pandas 2025. 1. 30. 22:28
데이터 분석을 하기 전에 데이터 전처리(Data Preprocessing) 과정이 필수적입니다.Pandas는 결측값 처리, 중복 제거, 데이터 변환 등의 기능을 제공하여 데이터를 정리하는 데 유용합니다.1. 결측값 처리 (Missing Values)데이터셋에는 종종 비어있는 값(NaN, null)이 포함되어 있습니다. 이를 처리하지 않으면 분석에 오류가 발생할 수 있습니다.(1) 결측값 확인하기import pandas as pd# 예제 데이터 생성data = {'이름': ['홍길동', '이순신', '강감찬', '김유신'], '나이': [25, 30, None, 40], '도시': ['서울', None, '대구', '부산']}df = pd.DataFrame(data)# 결측값 확인..