주가/주식 데이터 분석
코로나19로 인해 많은 사람들이 주식과 비트코인 등의 유가증권 또는 전자자산에 투자하는 열풍, 아니 광풍이 불고 있다.
여러가지 이유가 있겠지만 첫째로 국민들이 과거를 학습했기 때문이 아닐까 싶다. 즉, 과거 98년 IMF 부터 금융위기, 북한의 위협 등 국가 금융위기가 있을 때마다 기업의 주가가 폭락했다가 나중에 반등하는 사례를 보았기 때문일 것이다. 둘째는 투자 관련 정보를 많이 접할 수 있기 때문이 아닌가 싶다. 예전에는 증권회사의 지점에 직접 찾아가서 정보를 물어보고 투자했지만 요즘에는 온라인으로 많은 정보를 얻을 수 있고(물론 가짜 정보도) 채팅 앱이나 블로그, 유튜브를 잠깐만 찾아봐도 다 볼 수 없을 정도의 많은 정보가 쏟아져 나온다. 세번째 이유는 실제로 작은 개인의 성공사례가 전보다 많이 생겼고 그 소식이 동일 집단에 매우 빠르게 전파되기 때문에 말 그대로 투자 붐이 일어난 것 같다.
자본주의 사회에서 돈을 벌기위한 방법 중 하나로 유가증권(특히, 주식)은 말할 필요 없이 매우 중요한 부분을 차지 한다. 돈버는 방법이야 여러가지가 있겠다. 다른 말로 소득이라고 할 수 있는데, 통계청에 따르면 '가구소득'의 정의는 아래와 같다.
'한 가구나 그 가구의 개별 구성원이 1년간 또는 정기적으로 벌어들이는 현금 또는 현물 등의 모든 수입을 의미합니다.'
그리고 가구소득에서 총소득은 근로소득, 사업소득, 재산소득, 경상이전소득, 비경상소득의 합을 말한다.
즉, 돈 버는 방법이 근로, 사업, 재산, 기타로 분류 될 수 있을 것이다. 여기서 재산소득 중에 하나가 바로 주식 투자에 대한 배당 소득이다.
물론 많은 주식 투자자가 배당 소득 보다는 시세 차익을 목표로 투자한다. 짧은 기간에 많은 돈을 벌 수 있기 때문이다.(짧은 기간에 큰 손해를 볼 수도 있다)
이러한 주식 투자를 위해서 제일 중요한 것이 무엇일까?
정보! 바로 데이터라고 할 수 있겠다.
사실 정보는 떠도는 소문이나 풍문을 정보로 이용해서 투자를 시작하는 사람이 많이 있지만 많은 사람들이 실패하는 이유이기도 하다. 투자 가치가 그렇게 높은 정보가 공짜로, 그런 고급 정보가, 그렇게 쉽게, 당신에게 까지 알게 되었다는 게 이상하지 않나? 그리고 더 중요한 것은 이렇게 투자해서 수익을 본다해도 같은 방법으로 실패할 확률이 매우 높다. 성공한 투자는 기업에 대해서 많이 알아야 한다. 그래서 훌륭한 투자자들은 끈임없이 학습 한다. 기술분석이니, 가치투자이니, PER, EPS 등등등 끝임없이 학습하고 투자 회사에 대한 주가 뿐만 아니라 투자한/투자하려는 업종 및 기업의 사업 정보를 분석해야 한다. 이렇게 학습하고 분석해서 본인만의 투자 방법을 만들고 실행하며 발전해야 진정으로 성공할 수 있을 것이다.
자신만의 투자 방법을 만들기 위한 방법중 기본적으로 과거의 주가를 분석해서 패턴이나 특징을 찾는 것도 하나의 벙법일 수 있다. (서두에 말한 광풍의 이유중 하나인 국민들이 학습했기 때문이라는 것도 결국 과거의 패턴을 알고 있기 때문이다.) 이처럼 데이터 분석을 위해서 주가 데이터의 수집, 정재, 패턴/특징 찾기, 시뮬레이션, 선정/피드백, 파이프라인 자동화 등의 단계를 거칠 수 있겠다. 오늘은 제일 먼저 데이터 수집에 대해서 알아보자.
주가 데이터를 수집하는 방법에는 API, Web Crawling(웹 크롤링), 각 기업 Web Page 등이 있겠다. 데이터를 가지고 여러 방법으로 새로운 데이터를 만들거나 다른 데이터와 결합하는 등 다양한 처리와 계산이 필요하기 때문에(, 그리고 특히 자동 매수/매도가 필요하다면 결국) 증권사에서 제공하는 API를 통한 데이터 수집이 효과적이다. 그러나 쉽고 빠르게 간단한 데이터를 수집하고 분석하기에는 Web Crawling이 적합하다.
다음부터는 주식/주가 데이터를 수집하는 방법부터 하나씩 풀어보자.