금융

주식 등락률 상위 종목 로그

난개발자 2023. 1. 25. 18:28
728x90

https://engineerer.tistory.com/2

 

네이버 국내증시 웹 파싱

주식시장의 변화에 대해 확인하기에 네이버 국내 증시 페이지가 상당히 유용해 보인다. 위와 같이 잘 정리된 data를 원하는 부분만 parsing 하고자 하는 코드를 만들어보았다. import requests from bs4 imp

engineerer.tistory.com

이전 posting에서 naver 증시를 로깅하는 방법을 올렸었다.

 

그렇게 로깅한 데이터 중 일부를 git에 업로드 하였다. (1월 16일~1월 20일. Kosdaq 등락률 상위 종목 100개)

https://github.com/Namseop/stock

 

GitHub - Namseop/stock: stock_data

stock_data. Contribute to Namseop/stock development by creating an account on GitHub.

github.com

파일 하나는 가져와보면 아래와 같다

https://github.com/Namseop/stock/blob/main/230120/naver_%EC%A2%85%EB%AA%A9_090405.csv

 

 

 

dataframe을 가져오는 코드는 아래와 같다.

import pandas as pd
import urllib

def load_df(fname):
    data_df = pd.read_csv(fname, encoding="euc-kr")
    data_df['현재가'] = series_to_float(data_df['현재가'])
    data_df['전일비'] = series_to_float(data_df['전일비'])
    data_df['거래량'] = series_to_float(data_df['거래량'])
    data_df['시가'] = series_to_float(data_df['시가'])
    data_df['고가'] = series_to_float(data_df['고가'])
    data_df['저가'] = series_to_float(data_df['저가'])
    data_df['매수총잔량'] = series_to_float(data_df['매수총잔량'])
    data_df['매도총잔량'] = series_to_float(data_df['매도총잔량'])
    data_df.rename(columns={'등락률': '시가대비등락률', '등락률.1': '전일비등락률'}, inplace=True)
    return data_df

def series_to_float(input_series):
    return [int(temp.replace(',', ''))  if isinstance(temp,str) else temp for temp in input_series.to_list()]


data_df=load_df('https://raw.githubusercontent.com/Namseop/stock/main/230120/naver_'+urllib.parse.quote('종목')+'_090405.csv')

print(data_df)

이를 기준으로 machine learning 공부를 해보고자 한다.

 

728x90