-
주식 등락률 상위 종목 로그금융 2023. 1. 25. 18:28728x90
https://engineerer.tistory.com/2
네이버 국내증시 웹 파싱
주식시장의 변화에 대해 확인하기에 네이버 국내 증시 페이지가 상당히 유용해 보인다. 위와 같이 잘 정리된 data를 원하는 부분만 parsing 하고자 하는 코드를 만들어보았다. import requests from bs4 imp
engineerer.tistory.com
이전 posting에서 naver 증시를 로깅하는 방법을 올렸었다.
그렇게 로깅한 데이터 중 일부를 git에 업로드 하였다. (1월 16일~1월 20일. Kosdaq 등락률 상위 종목 100개)
https://github.com/Namseop/stock
GitHub - Namseop/stock: stock_data
stock_data. Contribute to Namseop/stock development by creating an account on GitHub.
github.com
파일 하나는 가져와보면 아래와 같다
https://github.com/Namseop/stock/blob/main/230120/naver_%EC%A2%85%EB%AA%A9_090405.csv
dataframe을 가져오는 코드는 아래와 같다.
import pandas as pd import urllib def load_df(fname): data_df = pd.read_csv(fname, encoding="euc-kr") data_df['현재가'] = series_to_float(data_df['현재가']) data_df['전일비'] = series_to_float(data_df['전일비']) data_df['거래량'] = series_to_float(data_df['거래량']) data_df['시가'] = series_to_float(data_df['시가']) data_df['고가'] = series_to_float(data_df['고가']) data_df['저가'] = series_to_float(data_df['저가']) data_df['매수총잔량'] = series_to_float(data_df['매수총잔량']) data_df['매도총잔량'] = series_to_float(data_df['매도총잔량']) data_df.rename(columns={'등락률': '시가대비등락률', '등락률.1': '전일비등락률'}, inplace=True) return data_df def series_to_float(input_series): return [int(temp.replace(',', '')) if isinstance(temp,str) else temp for temp in input_series.to_list()] data_df=load_df('https://raw.githubusercontent.com/Namseop/stock/main/230120/naver_'+urllib.parse.quote('종목')+'_090405.csv') print(data_df)
이를 기준으로 machine learning 공부를 해보고자 한다.
728x90'금융' 카테고리의 다른 글
호가창 정보 가져오기 (0) 2023.01.26 HTML Tag 공부 web page (0) 2023.01.26 네이버 증권 등락률 의미 (0) 2023.01.24 키움 api 비밀번호 종류 (0) 2023.01.18 오전 9시 주식 단타, 정말 다를까? (2) 2022.12.10