python 기초
-
Python의 datetime 모듈 활용법python 기초 2025. 2. 17. 23:32
Python의 datetime 모듈은 날짜와 시간을 다루는 강력한 기능을 제공합니다. 이 모듈에서 중요한 두 가지 개념은 datetime 클래스와 timedelta 클래스입니다. 이를 활용하면 날짜 및 시간 데이터를 생성, 수정, 계산할 수 있습니다.1. datetime 클래스datetime 클래스는 날짜와 시간을 함께 표현할 수 있는 기능을 제공합니다.1.1 datetime 객체 생성from datetime import datetime# 현재 날짜 및 시간 가져오기now = datetime.now()print("현재 날짜 및 시간:", now)# 특정 날짜 및 시간 지정specific_date = datetime(2024, 2, 17, 14, 30, 0)print("특정 날짜 및 시간:", specif..
-
pd crosstab 사용python 기초 2024. 10. 20. 17:59
In [1]: from IPython.core.display import display, HTMLdisplay(HTML("<style>.container {width:90% !important;}</style>")) In [2]: import seaborn as snsimport pandas as pdpd.crosstab? Signature:pd.crosstab( index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, margins_name='All',..
-
pandas dataframe index, column 가져오고 변경하기python 기초 2024. 8. 27. 21:40
pandas dataframe의 index와 column을 가져오고, 변경하는 방법은 아래와 같다 import numpy as npimport pandas as pdimport sklearn In [3]:A=np.random.sample(10)*5+2B=np.random.sample(10)*2+3C=np.random.sample(10)*3-1df=pd.DataFrame({'A':A, 'B':B, 'C':C})df Out[3]: ABC06.1616204.609621-0.18678613.9376654.9367750.96905523.8826884.0345691.48339035.8576423.1078701.66543344.7283883.322217-0.49469154.8714714.8591520.8019..
-
sklearn standard scalerpython 기초 2024. 8. 27. 21:19
데이터 표준화 적용시, sklearn의 standard scaler를 사용하는 경우, ddof=0의 편향 표준편차 를 사용한다.https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html StandardScalerGallery examples: Release Highlights for scikit-learn 1.5 Release Highlights for scikit-learn 1.4 Release Highlights for scikit-learn 1.2 Release Highlights for scikit-learn 1.1 Release Highlights ...scikit-learn.org 아래와 ..
-
pandas read_csv sep 옵션python 기초 2024. 8. 25. 16:06
pandas에서 read_csv 사용시 sep 옵션을 파일의 양식에 맞춰줘야한다대표적으로 콤마, 공백, tab 으로 나눠진 파일을 읽어오는 방식을 정리하려 한다.각각 sep 옵션에 ',', ' ', '\n' 을 넣으면 해결. In [1]:from IPython.core.display import display, HTMLdisplay(HTML(""))import pandas as pdimport seaborn as sns In [2]:df=pd.DataFrame({'A':[0,1,2,3],'B':[4,3,2,1],'C':['1','2','3','4']},index=[0,1,2,3])df Out[2]: ABC0041113222233314 In [3]:# 구분자 종류별로 저장df.to_csv('da..
-
pandas dadtaframe 수치형 / 범주형 분리python 기초 2024. 8. 24. 21:22
Data frame 처리를 하다보면 수치형과 범주형 데이터를 따로 처리하고 싶을 때가 있다.데이터 프레임을 분류하는 몇가지 방법이 있다.1. data frame에 _get_numeric_data 함수가 있어서 이를 써도 된다. : 편한 장점이 있는데, 범주형엔 별도의 함수가 없는 듯하다.2. select_dtypes 함수를 이용, 원하는 데이터 type만 가져올수 있다.3. dtypes를 보고 해당 dtype에 해당되는 column만 선택한다. : 약간 불편하지만, 데이터 타입들을 확인하고 갈수 있어서 더 안심이 되는 느낌이다. In [1]:from IPython.core.display import display, HTMLdisplay(HTML(""))import pandas as pdimpo..
-
numpy array slicing이 원본 크기를 넘어 섰을 때python 기초 2024. 1. 1. 00:11
numpy array를 slicing하는 데, 원본 크기보다 더 큰 범위를 slicing하여도 원데이터를 벗어나지 않는 크기로 slicing을 한다는 것을 알았다. 아래와 같이 array를 만들고 위치를 slicing하면 해당 위치의 값이 나온다. import numpy as np a=np.array([[1,2,3,4,5,6,7,8,9,10], [11,12,13,14,15,16,17,18,19,20], [21,22,23,24,25,26,27,28,29,30], [31,32,33,34,35,36,37,38,39,40]]) print(a[1:4,3:5]) 아래와 같이 해당 위치의 sub array가 나오게 된다. [[14 15] [24 25] [34 35]] 이 때, slicing하는 범위가 기존 array..