keinoblog's blog

ながおけいのブログ

ポーカーにハマって気付いた、期待値よりも大事なたった一つのこと

少しブログぽいタイトルをつけてみました。

 

今日はタイトルの通り「ポーカーにハマって気付いた、期待値よりも大事なたった一つのこと」について書きます。

 

少し長くなりそうなので始めに目次です。

■ そもそもポーカーとは?
■ ポーカーを大好きになった理由
■ ポーカーにハマって気付いた、期待値よりも大事になこと
■ (おまけ)参考までに少し詳細なポーカーの説明
※「ポーカーにハマって…」以外の部分は只々ポーカーへの愛を語っているようなものなのであまり本題とはほぼ関係ないです。というか全く関係ないです。。

 

■ そもそもポーカーとは?

ざっくり言うと、ポーカーはトランプゲームの一つで、「フルハウス」「ツーペア」「ストレート」等といった「役」があるなかで、各選手が自分の手をみ、相手の手を推測し、お金を賭けていくゲームです。

自分の方が強いと思えばお金をたくさん賭け、弱いと思えば降りる。あるいは自分の手の強さ、弱さに限らず相手が弱そうであればたくさん賭けて相手を降ろしに行ったりもする。ざっくりと言えばそんなゲームで、日本では知名度が比較的低いものの、世界的にはオンラインポーカーだけでも競技人口が7000万人を超えています。

 

■ ポーカーを大好きになった理由

ポーカーを初めて知ったのは確か高校1年生の時。

アメリカに留学していて世界大会の様子をESPNという最大手スポーツチャンネルで見たときでした。当時は近所のおじさん・おばさんたちと大富豪をやるような感覚で遊びでやったりしていました。

本格にハマり出したのは2014年12月で、友人の誘いで都内のカジノバーに遊びに行った時でした。

当時は気付いてなかったですが、今となって思うとポーカーにハマり込んだのは「自分の知力をかけて勝負する感覚」がこの上なく楽しかったからだと思います。

ポーカーでは相手プレイヤーが持っている手は見れず、いわゆる「不完全情報ゲーム」といって、最適な意思決定をする上で必要な情報が欠けているゲームです。将棋、チェス等の「完全情報ゲーム」とは難しさの種類が少し異なり、情報の不完全性こそが最適な意思決定を難しくさせていて、逆に情報が完全であれば最適な意思決定はあまり難しくなく、ちょっとした計算と運のゲームになります。そう「情報が不完全な中で如何に最適な意思決定をするか」がポーカーのポイントなわけです(多分)。

となった時にやるべきことは2つあって、

・情報の不完全性を減らすこと
・不完全な中でも出来るだけ最適な意思決定をすること

になりますが、前者に関しては相当難しく、例えば相手の表情や仕草等を観察して相手の手を見抜こうと頑張っても良いですが、最後まで予測のレベルを超えられないので結局は不完全性が残ります。

そうするとやはり後者。最適な意思決定を頑張ってすること。

一般論として意思決定の手順の原則は
1、選択肢の列挙
2、選択肢に対する期待値の評価
3、状況に応じた選択肢の選定
とされていますがポーカーで難しいのはこの「期待値の評価」、つまり「ある選択をした時、どれくらいの確率でどれくらいの見返りがあるだろうか」を推定することです。

情報がみんな同じく平等に不完全ななかで、人より高い精度で「期待値の評価」をするためには、限られた情報のなかからより多くの理解を得なければなりません。

例えばジャンプが大好きな3人の小学生に「今週の土曜日がジャンプの発売日である可能性はどれくらい?」と聞いた時に、

小学生A「ジャンプはどうやら週1で発売されている。発売されている確率は1/7だ。」
小学生B「ジャンプは基本月曜発売だ。前に土曜発売の日もあったが、確率は薄い。」
小学生C「ジャンプは基本月曜発売だ。どうやら月曜が祝日だと土曜に発売されるみたいだが、来週月曜は祝日。今週土曜に発売される確率はかなり高い。」

とそれぞれ答えたとします。

「毎週月曜、そして時々土曜等にジャンプが発売されている」という同じ情報を受け取ったに関わらず、その情報から理解した内容は小学生3人の間で違います。

小学生Aは「単純な発生確率」を計算するにとどまる中、小学生Bは「周期性」を見出し、更に小学生Cは周期性に加え「周期性のない事象(土曜発売)の発生の仕組み」を推測することが出来ています。

ポーカーもこんな感じです。

同じ情報から如何に多くの事を理解するかが大事です。

 

■ ポーカーにハマって気付いた、期待値よりも大事なこと

かなり(実は関係のない(笑))前置きが長くなりました。

いきなりですが、質問です。

皆さんはあるゲームへの参加権を得ました。
参加費は無料。
ゲームは単純明快。箱からくじを1枚引き、くじの内容に応じてお金をもらうor払うゲームです。
箱は5パターンあり、クジの内容が異なります。
どの箱を選びますか?

パターンA:「+500円」「+100円」「0円」
パターンB:「+900円」「0円」「-300円」
パターンC:「+200円」「+200円」「+200円」
パターンD:「+1200円」「0円」「-900円」
パターンE:「+9000円」「0円」「-9600円」

なんとなく人気が出そうなのはAとCでしょうか。
なんといってもリスクなく、お金獲得のチャンスを得られます。どうみても美味しい話です。「確実にお金を得たい!」人はCを、「200円は寂しい!ワンコイン500円狙いたい!」という人はAを選ぶ感じでしょうか。

次に人気そうなのはBとDな気がします。
「もしかしたらお金を失うかもしれないけど、ランチ代をゲットできるかもしれない!」といった感じです。なかでも「期待値が高い方がいいでしょ!」と思う人はBを、「そこは1200円狙いに行くでしょ!と思う人はDを選びそうです。

最後に人気(むしろ不人気w)そうなのがEです。
なんといっても期待値がマイナスですw 確かにいきなり9000円得られるチャンスはありますが、同じ確率で9600円失う可能性があります。「いや、9000円ほしいんだ!!」て人が選びそうです。

これらの選択肢を少し整理してみると下記の様な表にまとめられます。

f:id:keinoblog:20160323052824p:plain
※MAX:もらえる最大額、MIN:もらえる最少額/支払う最大額

期待値が高い選択をするならABC。
そのなかで損失を出さない事を優先するならAC。
さらにがっかり度(MAXとMINの差)を最少化するならC。

期待値以外の指標を選ぶならDE。
そのなかで期待値マイナスでも最大MAXを求めるならE。

という感じで選択肢を評価できます。

ポーカーは基本的に選択の回数が多く、十分な時間プレイすれば色々な結果は収束していきます。つまり期待値の高いプレイをすればプラスになるし、低いプレイをすればマイナスになります。なので期待値の高い選択をし続けることがとても大事です。

そんなことを頭でわかりつつ最近素直に気づいたことは、「自分は期待値に興味がない」ということでした。

もちろん「興味がない」というと言い過ぎな感じもします。もちろん勝ちたいので、期待値高くプレイする必要があるのは分かっています。ただ「期待値よりもMAX値に興味がわいてしまう」気質だったのです。

こんな僕にとってポーカーが強くなりたいと思った時に一番大変だったのはこの性質の矯正でした。

ポーカーで勝つには期待値の高いプレイを我慢強く続ける必要があるのです。

期待値を基準に選択する必要があるのです。

しかし人生ではどうでしょう。

 この選択論を人生に適用する際、三つの観点を考える必要がありそうです。

一つは本当に手に入れたいものは何なのか。

二つ目はジワジワ進めば手に入れられそうなのか。間に合うのか。

三つ目はそのプロセス自体が人生ということです。

ということです。

そもそも人にとっての価値て個人特有のラインがある気がします。先程の例、人によっては200円ではもらってももらわなくても幸せの変化はないかもしれません。大金持ちであれば、「200万くらい勝たないと勝った感じがしない」と言うかもしれません。僕は200円でも有難く頂きたいです。

 人生において手に入れたいものは何なのか、どこに基準があるのか、見定める必要があります。

そしてそれを見定めたなら、今のアプローチで到達できそうかも考える必要がありそうです。いくら期待値の高い選択をしていても、自分にとって意味のあるものを手に入れることができなければ、あまり意味がなさそうです。

目標が高い場合、もしかしたら期待値がマイナスな選択を取らざるを得ないかもしれません。期待値に縛られてジャンプできなくなってしまっては本末転倒な感じがします。

大事なのは手に入れたいものを手に入れることです。

またとはいえプロセス自体も人生だったりするので、自分がやっていて楽しいプロセスを選ぶことも大事なのかな、とも思ってみたりしました。

期待値より大事なものが人によってはあるんだと思います。
ポーカーはそのことに気づかせてくれました。

 

■ (おまけ)参考までに少し詳細なポーカーの説明

実はいくつかポーカーの形式がありますが、僕がハマっている「ノーリミットテキサスホールデム」では各プレイヤーは合計7枚のトランプを使って役を作りにいきます。(7枚のトランプから好きな5枚を組み合わせて役をつくるのです。)

7枚は各プレイヤーに個別に配られるトランプ2枚と全プレイヤーに共通で配られるトランプ5枚に分けられ、特に共通の5枚は「最初に3枚」→「次に4枚目」→「更に5枚目」という感じで段階的に開示されていきます。

共通のカードが段階的に開示されていくなか、プレイヤーたちは「賭け行為」を通じて勝負していきます。「賭け行為」はざっくり3種類「のるか」「増やすか」「降りるか」があり、各プレイヤーの掛け額が揃ったタイミングで共通カードは次の段階のものが開示されます。

つまり、プレイヤー達は個別に2枚のトランプをもちつつ、共通の5枚のカードが「まだ1枚も開示されていない段階」「3枚開示された段階」「4枚開示された段階」「5枚すべて開示された段階」の合計4段で「賭け行為」を行います。

そして最終的には「もっとも強い役を持っているプレイヤー」か「最後まで降りずに残ったプレイヤー」がそれまでにかけられた「賭け金」を全て入手できます。

少し、難しいですね…。

分かりやすいか分かりにくいか分からないですが、映像だとこんな感じです。

www.youtube.com

2枚のトランプを捨てているプレイヤーは「降りた」プレイヤーです。
画面左上に「掛け金の総額」、画面左下に「各プレイヤーの個別の2枚のトランプ」、右下に「5枚の共通のトランプ」が(視聴者用に)表示されています。