6. DataProcessing


데이터는 퀀트투자에서 가장 중요함

1. MarketData

이렇게 생긴건데 여기에선 행을 Tick이라고 부름

  • Date, Time은 거래시간
  • Ticker : 어떤 주식
  • Last Trade, Volume : (Trade Data) 얼마가 거래되었는지에 대한 정보
  • Bid Size, Bid, Ask, Ask Size : (quote Data) 얼마에 거래를 요청했는지 정보

초당 200개의 거래 데이터가 생길 수도 있음
그래서 동일한 시간이나 날 단위로 데이터를 퍼옴

이렇게 가져온 데이터로 OHLC CHART를 만들 수 있음

차트내에서는 최고점, 최저점, 거래량을 확인 할 수 있음

2. Corporate Actions (기업행동)

주식에 영향을 미치는 행동

1) Stock Splits

이와 같이 아마존도 최고점을 찍었을 때 주가를 1/2로 만들어 벌인 적이 존재. 이를 Stock Splits라고 부름

Total Market Capitalization(총 자본 총액) = the dollar value of a company's outstanding shares (기업이 발행한 총 주식발행액) = stockprice * (total number of shares outstanding)

왜 stock splits 하는 것인가?
1. 주가가 낮아야 현재 주주들과 잠재적 주주들이 유입됨

실재로 아마존은 몇 번 더 stock splits 한 징후가 보임

지표는 낮아진거 같아 보이지만 실재로는 가격이 낮아지지 않음
이를 normalize 해보면 이와 같은 그래프를 보임

이를 위해 stock split 하기 전에 주가를 2배 혹은 3배로 잡아 놓고 계산하면 됨

2) Dividend(배당금)

기업의 잉여자금을 주주들에게 나누어 주는 것

자주 배당금을 나누어 주는 기업 중 하나는 퀄컴인데, 배당금은 매 주에 하나씩 지급함
하지만 모든 주주들에게 배당금을 나누어 주는 것은 아닌데
ex-dividend date 이전에 주식을 구매한 주주들에게만 돈을 나누어줌


배당금을 나누어주는 지표를 보면

  • 02/08/18 에 배당금 지급을 약속하였다.

  • 03/29/18 에 배당금을 지급하기로 하였다.

  • 03/14/18 은 배당금 지급 주주들의 기준 날짜이다.

    여기에서 중요한 것을 배당금에 따라 주식가격을 조정해야 한다.

    왼쪽과 오른쪽 그래프 모두 49.5 달러에서 주식이 마감되었다. ex-dividend date 는 01/18 이다.

    주가만 보면 두 주주모두 0.5 달러를 50달러에서 잃은 것처럼 보이지만 왼쪽은 배당금 1달러를 주었기에 오히려 0.5 달러를 번꼴이 된다.

    그렇기에 이러한 지표를 normalize 하기 위해서는

    1 + D/S

    공식을 활용하여야 한다.

  • D는 Dividend

  • S는 Stock price at ex-dividend date

    이때 1이 앞에 붙은 이유는 S의 값이 당연히 D보다 크기 때문에 D/S는 소수값이 나온다. 따라서 1을 붙이여 원래의 값으로 만들어 주기 위함이다.

3. 활용법

이렇게 normalize한 그래프는 어떻게 사용하여야 하는 것일까?

이렇게 만들어진 그래프는 언제 사고 팔지를 결정할 수 있다. 즉 전략을 짜는데 유용하다.

우리는 normalize 한 데이터에서 expected price를 결정할 수 있음
그렇다면 expected price란 무엇인가?

현재 가장 많이 사용하는 것은 최근 평균 값임
일정기간을 잘라서 평균값을 내는 방식

모든 지점을 찾아서 선을 이어내면 이러한 모양을 발견할 수 있음
이를 Simple Moving Average(Rolling Mean)

여기의 그래프를 통해 언제 주식을 사고 팔지를 결정할 수 있음

그리고 여기에서 Constant Threshold 과 Fraction Threshold을 발견할 수 있음
어떤 주식은 일정하게 유지 되지만 어떤 주식은 급하게 뛰어오르는 경향이 있음

이 역시 그래프로 표현하면 이러한 모양을 발견할 수 있음

이는 곧 최고점과 최저점을 연결한 그래프들이라고 생각해 볼 수 있음

그렇다면 이렇게 만들어진 그래프를 어떻게 활용하는 것이 맞을까?
최저점을 찍은 주식을 사는게 맞을까?
과연 거기가 진짜 최저점일까?

그렇기에 여기에서 발견한 것이 Inflection Points임
Inflection Points 는 가격이 밴드보다 아래로 내려간다음 평균으로 다시 치솟는 시점을 이야기 함

위의 그림에서처럼 보라색으로 되어 있는지점에서 주가가 꺾이기 때문에 구매하면 좋은 지점이라고 생각이 듬

반대로 위에서 꺾였다면 그때 파는 것이 좋음

4. Missing Values

주식은 정말 거의 모든 것에 영향을 받음 예를 들어 시장이 쉬는 날, 회사 발표날, 뉴스 기사, 정치적 이벤트, 자연재항까지 모두 말이다.

그렇기에 주식을 한다면 두가지 전략이 나온다.
1. 가치투자 = 주식 외적인 부분이 주가에 영향을 준다고 생각하는 투자방법
2. 퀀트투자 = 주식 외적인 부분이 주가에 영향을 미치지 않는다고 생각하는 투자방법

정리하면 주가에 영향을 미칠 수 있는 것은

시장이 쉬는 날, 시장이 열고 닫는 시간, 회사 발표날, Corporate Actions, 뉴스 기사, 정치적 이벤트, 자연재항

이 있다.

추가적으로 주가에 영향을 미치는 것은


IPO(기업공개) 날짜가 있었다면 이를 어떻게 처리하는 것이 맞을까?
가장 좋은 것은 IPO 이전까지는 IPO 날에 밝히어진 가격으로 채우는 것이다.
하지만 이건 큰 문제가 아니다.

좀 더 큰 문제는 delisted(상장폐지) 되는 것이다.
파산되거나, 개인 투자자가 기업을 사는 경우다

바로 DELL 이 2013 이그렇다.

중요한 것은 이러한 가치를 어떻게 처리할지는 당신에게 달리었다.
다만 그냥 무지하는 것은 좋은 선택이 아니다.

5. Survivor Bias(Survivorship bias)

Survivor Bias(Survivorship bias) 혹은 생존자 편향의 오류라는 개념이 존재한다.
A. 랜덤으로 뽑은 주식 2005년부터 오늘까지 살아남은 100개의 주식을 계속 가지고 있는 전략
B. 랜덤으로 뽑은 주식 2005년에 잘나가는 100개의 주식을 계속 가지고 있는 전략

이 두가지를 생각해 보자

결론적으로 A전략은 더 높은 가격을 현재까지 유지 될 가능성이 높다. 이게 바로 생존자 편향의 오류이지만, 주식시장에서는 이게 작동 되는 경우가 많다.

6. Exchange Traded Funds

그러다면 알고리즘 트레이들의 목표는 무엇일까?

바로 돈을 만드는 것이다.

하지만 주식 시작은 예측이 불가능함
돈을 많이 벌려면 급성장하는 주식을 사야하지만 그 주식이 언제 떨어질지는 모르는 일임

이러한 일을 막기 위해서 주식 포트폴리오가 반드시 필요함

그리고 이렇게 만들어진 포트폴리오에서 우리가 골라야 하는 주식은

이익은 좋으며 동시에 손해는 적은 주식이어야함
하지만 세상에 그런건 존재하지 않음

그래서 은행은 보통 두가지 중 하나의 전략을 취함

이익과 위험을 모두 낮추거나
이익과 위험을 모두 높이거나

포트폴리오에 넣을 만한 것 중 하나가
혹은 모든 주식을 일부분 공유하는 Exchange Traded Fund(ETF) 를 사용하는 방법도 있음
가장 인기 있는 ETF는 Standard & Poor's 500 or S&P 500(SPY) 임
이 ETF는 마켓에서(New York Exchange or Nasdaq) 500개의 주식을 공유하는 주식임

profile
예술가

0개의 댓글

Powered by GraphCDN, the GraphQL CDN