Game Theory Optimal

minchan jung·2022년 1월 13일
0

Game Theory Optimal?

들어가며

알고리즘를 공부하다 살짝 깊게 알아보면, 수학을 만난다. 가깝게는 확률 통계, 미적분학, 선형대수를 종종 만났던 것 같다.
그러다, 내가 정답이 없는 의사결정을 할때 수치적으로 무언가를 판단해볼 수 있는 프로그램이나 계산법 같은것이 있지 않을까 생각했었다.

모호한 것들의 수치화가 가능할까?

이것도 맞고 저것도 맞을 수 있는데 양갈래 옵션중에 어떤길을 선택했을때 더 효율으로 결과물에 도달 할 수 있을까? 반대로 최악의 상황에서 어떤 의사 결정이 손해를 덜 볼 수 있을까? 등에 대한 수치화를 시켜보고 싶은 생각이 들었다.

이런 모호한 상황을 통계적으로 수치화 시킬 수 있는 방식이 분명히 있다. 시장의 흐름을 파악하는 경제학이야 말로 모호한 상황을 수치화한 끝판왕이지 않을까?

의사결정에 필요한 데이터 수치화

이 흐름을 따라가다 MIT 포커의 수학적으로 플레이를 하는 강의를 보게 되었다. 강의
여기서 GTO를 소개하는데 2015년 강의라 올드하지 않을까? 하면서 최근 유투브 포커 영상들을 조금 참조 해보았다.
현재 포커 Top 플레이어들이 GTO 기반 수학적으로 또 기계적으로 많이들 플레이 한다고 한다. 단 한번의 팟을 이기는 이론이 아니라 경기 전체를 운영하는 차원에서 이 이론을 기반으로 한다는게 맞는듯 하다.

내가 찾고 싶었던 것!(딱 맞진 않지만) 수 많은 변동 사항들이 있을텐데, 이때 수치적으로 어떻게 접근하면 가장 성공적으로 접근할 수 있는지 통계를 바탕으로 데이터화 한 이론! 물론 포커에 한에서 말이지만..

GTO

GTO 플레이란?
포커 플레이에서 상대방의 핸드의 레인지 범위를 Comb(Combination-조합) 계산하고, 기대값 EV를 동시에 가늠해서 이 수치 데이터로 항상 일관되게 마치 기계처럼 수학적으로 플레이 하는 방식이다.

콤보 계산이란?
내가 이길 수 있는 조합의 갯수 와 상대가 나를 이길 수 있는 조합의 갯수를 계산하면 카드의 조합 비율로 내가 이길 수 있는 확률이 나온다. 여기에서 지금 내가 가지고 있는 스택 사이즈 대비 현재 팟에 걸려있는 돈 + 내가 배팅해야 할 또는 콜 해야할 또는 감당 해야할 금액을 비율로 계산하면, 이 팟에서의 기대값 EV가 나온다.
내가 지금 이 한판을 따라 갔을때의 전체적인 에쿼티를 두 카테고리로 나눠서 확률로 비교해볼 수있는 것이다. 그리고 역설적인것이 실제 내가 현재 이 팟에서 이길 수 있을까?에 대한 답과는 무관하게 전체적으로 40:60 의 비율을 유지하며 플레이 하는 것이다. 설령 지금 질게 뻔해도 저 비율을 유지하려고 말도 안되는 무리한 배팅 상황이 나올 수도 있는 것이다. 어찌 됬든 비율을 잘 계산해서 유지하면 무족곤! 내가 1등이 되는 결과는 변함없다!

물론 토너먼트에서 처럼 시간 제한에따라 블라인드 사이즈가 올라가거나 플레이의 시간이 정해져 있다면, GTO 기반 플레이는 힘을 많이 잃는다고 한다.
확률은 시행 횟수가 높아지면 그 수치에 수렴하기 마련이기 때문에 당연한 것 같다.
그래서인지 몰라도 현재 탑 플레이어들은 토너먼트 보다 Cash 플레이를 선호 한다고 한다. 운에 맡기기 보다 훈련된 방식으로 수치화 하면서 수익을 내는게 옳아 보이긴 한다.

현재 상황이란?
승리 확률을 상대가 현재 내 핸드에서 이길 콤보와 내가 플랏, 턴, 리버(프리플랏이라면 플랏에서, 플랏 상황이라면 턴에서, 턴이라면 리버에서..) 차례로 이길 수 있는 넛, 세컨 콤보를 계산 하면서 세분화 할 수도 있다. 너무 복잡해 질 수 있지만, 대부분의 탑 플레이어는 미니멈 핸드 레인지 내에서 빠르게 계산해서 exploit을 적용한다고 한다
(exploit: 이미 노출된 상대방의 의사결정 성향 정도를 파악하는 것. 상대의 핸드 레인지를 결정할때는 배팅 포지션을 우선시 하고 + exploit 한다고 한다. 점점 이해하기 어려워진자 ㅠ)

그 밖에..

정말 많은 내용있다. 다른 의사 결정에 적용할만한? 포커가 아니라도 도움이 될만한 내용은 실질적으로 없는것 같다. 응용해서 생각해볼 순 있겠지만.. 아주 철저하게 포커 플레이에 대한 내용이 전부인듯하다. 용어도 굉장히 많이 나오는데 포커 용어를 모르면 거의 못알아 들을 지경이다.ㅠ

결론은?

포커를 재미삼아 몇번 해보았지만 이렇게 심오하게 생각해본적은 없다. 그런데 너무 답이 나와있는 방식에서 왜 다 이렇게 못하는거지? 당연히 그만큼 어렵다는 거겠지? 매 순간을 이런 방식으로 수치화 하며 의사결정 할 수는 없다. 내가 삶의 중요한 의사결정을 할때에는 뭔가 내가 살아온 방식에서 이럴때 어떻게 했더니 어떠한 결과가 있었다. 어떠한 과정이 있었다 정도는 내 돼(?)뇌 메모리 보다 다른곳에 기록을 해두면서 나만의 데이터를 만들고 정형화해 참조할 필요는 반드시 있어 보이기는 한다.

나는 기록은 어디에든 곧 잘한다. 하지만 정리가 잘되지 않는 단점이 있다. 정리 되있어 보이는것 같지만 어지러워 보이는게 너무 많다. 그리고 정리할 샘치면 너무 많아서 시작도 잘 못하게 된다 ㅠ
너무 많은걸 또 적기도 하는것 같다. 여기에도 적었다가 저기에도 적었다가..
노트 기록이 사실 대부분이다. 디지털화 하는 작업은 얼마 되지 않았다.
그래도 일단 계속해서 기록하자! 정리는 내가 못하면 프로그램으로 하면 되것징!!

MIT Poker thoery
Jonathan Little
Daniel Negreanu
Douglas K. Polk

0개의 댓글