금융
주식 등락률 상위 종목 로그
난개발자
2023. 1. 25. 18:28
728x90
https://engineerer.tistory.com/2
네이버 국내증시 웹 파싱
주식시장의 변화에 대해 확인하기에 네이버 국내 증시 페이지가 상당히 유용해 보인다. 위와 같이 잘 정리된 data를 원하는 부분만 parsing 하고자 하는 코드를 만들어보았다. import requests from bs4 imp
engineerer.tistory.com
이전 posting에서 naver 증시를 로깅하는 방법을 올렸었다.
그렇게 로깅한 데이터 중 일부를 git에 업로드 하였다. (1월 16일~1월 20일. Kosdaq 등락률 상위 종목 100개)
https://github.com/Namseop/stock
GitHub - Namseop/stock: stock_data
stock_data. Contribute to Namseop/stock development by creating an account on GitHub.
github.com
파일 하나는 가져와보면 아래와 같다
https://github.com/Namseop/stock/blob/main/230120/naver_%EC%A2%85%EB%AA%A9_090405.csv
dataframe을 가져오는 코드는 아래와 같다.
import pandas as pd
import urllib
def load_df(fname):
data_df = pd.read_csv(fname, encoding="euc-kr")
data_df['현재가'] = series_to_float(data_df['현재가'])
data_df['전일비'] = series_to_float(data_df['전일비'])
data_df['거래량'] = series_to_float(data_df['거래량'])
data_df['시가'] = series_to_float(data_df['시가'])
data_df['고가'] = series_to_float(data_df['고가'])
data_df['저가'] = series_to_float(data_df['저가'])
data_df['매수총잔량'] = series_to_float(data_df['매수총잔량'])
data_df['매도총잔량'] = series_to_float(data_df['매도총잔량'])
data_df.rename(columns={'등락률': '시가대비등락률', '등락률.1': '전일비등락률'}, inplace=True)
return data_df
def series_to_float(input_series):
return [int(temp.replace(',', '')) if isinstance(temp,str) else temp for temp in input_series.to_list()]
data_df=load_df('https://raw.githubusercontent.com/Namseop/stock/main/230120/naver_'+urllib.parse.quote('종목')+'_090405.csv')
print(data_df)
이를 기준으로 machine learning 공부를 해보고자 한다.
728x90