-
Pandas로 데이터 불러오기 및 저장하기pandas 2025. 1. 30. 22:25728x90
1. 데이터 불러오기
Pandas에서는 다양한 파일 형식의 데이터를 쉽게 불러올 수 있습니다. 대표적으로 CSV, Excel, JSON, SQL 데이터베이스 등이 있습니다.
(1) CSV 파일 불러오기
CSV(Comma-Separated Values) 파일은 가장 일반적인 데이터 파일 형식 중 하나입니다.
import pandas as pd # CSV 파일 불러오기 df = pd.read_csv("data.csv") # 데이터 출력 print(df.head()) # 상위 5개 행 출력
추가 옵션:
- sep=";": 구분자가 ,가 아닌 ;일 경우 지정 가능
- encoding="utf-8": 인코딩을 명시적으로 지정할 수 있음 (예: 한글 파일은 encoding="cp949")
(2) Excel 파일 불러오기
Pandas는 Excel 파일도 쉽게 읽을 수 있습니다.
df = pd.read_excel("data.xlsx", sheet_name="Sheet1") print(df.head())
엑셀 파일을 읽으려면 openpyxl 패키지가 필요할 수 있습니다. 설치하려면 다음 명령어를 실행하세요.
pip install openpyxl
(3) JSON 파일 불러오기
JSON 데이터도 Pandas에서 쉽게 다룰 수 있습니다.
df = pd.read_json("data.json") print(df.head())
(4) SQL 데이터베이스에서 불러오기
SQL 데이터베이스의 데이터를 Pandas로 가져올 수도 있습니다.
import sqlite3 # 데이터베이스 연결 conn = sqlite3.connect("database.db") # SQL 쿼리 실행 후 데이터 불러오기 df = pd.read_sql("SELECT * FROM users", conn) print(df.head()) # 연결 닫기 conn.close()
2. 데이터 저장하기
Pandas에서 데이터프레임을 파일로 저장하는 방법도 매우 간단합니다.
(1) CSV 파일로 저장
df.to_csv("output.csv", index=False, encoding="utf-8")
- index=False: 인덱스를 저장하지 않음
- encoding="utf-8": 인코딩 설정 가능
(2) Excel 파일로 저장
df.to_excel("output.xlsx", index=False)
- 엑셀 저장 시 openpyxl 패키지가 필요할 수 있음
(3) JSON 파일로 저장
df.to_json("output.json", orient="records", indent=4)
- orient="records": 리스트 형태로 저장
- indent=4: JSON 파일을 보기 좋게 저장
(4) SQL 데이터베이스에 저장
conn = sqlite3.connect("database.db") df.to_sql("users", conn, if_exists="replace", index=False) conn.close()
- if_exists="replace": 기존 데이터를 덮어쓰기
- if_exists="append": 기존 데이터에 추가
3. 마무리
이번 포스팅에서는 Pandas로 데이터를 불러오고 저장하는 방법을 다루었습니다. Pandas는 다양한 데이터 형식을 다룰 수 있어 매우 강력한 도구입니다.
다음 글에서는 데이터 전처리 및 정리에 대해 다룰 예정이니 기대해 주세요! 😊
728x90'pandas' 카테고리의 다른 글
Pandas와 Scikit-Learn을 활용한 머신러닝 모델 만들기 (0) 2025.01.30 Pandas를 활용한 실전 데이터 분석 예제 (0) 2025.01.30 Pandas를 활용한 데이터 분석 및 시각화 (0) 2025.01.30 Pandas를 활용한 데이터 전처리 및 정리 (0) 2025.01.30 Python Pandas 기초: 데이터 분석의 시작 (0) 2025.01.30