2026年1月4日日曜日

麻雀は、ゲーム理論の観点から見ると**「不完全情報ゲーム」**の極致

麻雀をゲーム理論で、雑学や業界話を交えながら、解説してください。

面白いテーマですね。
麻雀は**「完全情報ゲームではないのに、ゲーム理論の要素が非常に濃い」**という点で、将棋や囲碁とはまったく違う知的遊戯です。
ここでは ゲーム理論・確率・心理・業界話を混ぜながら解説します。


1. 麻雀は「不完全情報・多人数・ゼロサムに近い」ゲーム

ゲーム理論的な分類

麻雀は次の特徴を同時に持ちます。

  • 不完全情報ゲーム
    → 他家の手牌は見えない(ポーカーと同類)

  • 多人数(4人)ゲーム
    → 2人ゲームより理論解が極端に難しい

  • ゼロサムに近いが完全ではない
    → 点棒のやり取りは基本ゼロサムだが、順位点や供託が絡むと歪む

この条件がそろうと、
ナッシュ均衡の厳密解は事実上不可能になります。

▶ だからこそ
「理論で100%勝つ方法が存在しない」
人間の読み・癖・感情が介入できる余地が残る


2. 「打牌」は期待値最大化問題

基本は EV(Expected Value)

麻雀の1打は、

この牌を切ったときの
将来の得点 − 放銃リスク − 流局リスク

期待値を比較しています。

  • リーチをかける

    • 和了率 ↑

    • 放銃率 ↑

    • 打点 ↑

  • ベタ降り

    • 放銃率 ↓

    • 和了率 ≈ 0

これは完全に
📈 期待値最適化問題
=ゲーム理論の基本そのもの。


3. 「守備」はミニマックス戦略

放銃=即死に近い

麻雀は、

  • 1回のミスで トップ → 最下位

  • 長期戦ではなく 短期・高分散

という特徴があります。

そのため、

最大損失を最小化する
ミニマックス戦略

が非常に重要。

プロが言う「押し引き」とは?

  • 押し:期待値最大化

  • 引き:最悪ケース最小化

▶ 実はこれは
金融のリスク管理とほぼ同じ構造。


4. 鳴きは「情報公開による戦略変更」

鳴く=情報を売る行為

ゲーム理論的に見ると、

  • 鳴く
    → 自分の手牌構成を部分的に公開

  • 門前
    → 情報秘匿性が高い

これは、

「スピード」と
「情報価値」のトレードオフ

業界話

プロの世界では、

  • 素人ほど鳴きたがる

  • 強者ほど情報を隠す

これは
「情報非対称性」を最大化する戦略。


5. リーチは「コミットメント戦略」

ゲーム理論でのコミットメント

リーチとは、

「私はこれ以上戦略を変えません」

という強制宣言

これにより、

  • 他家は行動を制約される

  • 守備的行動が増える

  • 自分の期待値が上がる場合がある

▶ これは
冷戦時代の核抑止理論と同型。


6. 麻雀AIとゲーム理論の限界

なぜ麻雀AIは「人間的」?

将棋AIは完全に理論化されましたが、 麻雀AIは今も

  • モンテカルロ法

  • 強化学習

  • 統計的近似

が中心。

理由は簡単で、

  • 状態空間が天文学的

  • 情報が欠落している

  • 他家の「感情」が影響する

▶ つまり麻雀は
純粋理論だけでは勝てない


7. 業界話:プロ雀士は「心理学者」

プロの対局解説でよく聞く言葉:

  • 「この人、守備が甘い」

  • 「ここは降りられない人」

  • 「トップ目になると絞る」

これはすべて
相手の戦略傾向(タイプ)をモデル化している。

▶ ゲーム理論で言えば
混合戦略を読むゲーム


8. 麻雀が人生論になる理由

あなたがこれまで関心を持ってきた
「不完全性」「同調」「引き際」との接点も深いです。

  • 常に最善手は分からない

  • 運と実力が分離できない

  • 勝ちすぎると狙われる

  • 引き際を誤ると破滅する

これは、

  • ゲーデル的不完全性

  • 社会的ゲーム

  • 人生の意思決定

と非常に似ています。


まとめ(麻雀のゲーム理論的本質)

麻雀とは:

  • 完全解が存在しないゲーム

  • 期待値と最悪ケースの綱引き

  • 情報・心理・確率の混合戦

  • 「合理性だけでは足りない」ことを教える教材

だからこそ、

麻雀が強い人は
人生でも「致命傷を避ける」のが上手い

…と、業界ではよく言われます。

もし次に進むなら、
「麻雀とポーカーの決定的違い」や
「なぜ麻雀はギャンブル依存を生みにくいか」
も面白い話になりますよ。

麻雀は、ゲーム理論の観点から見て極めて魅力的なゲームです。将棋や囲碁のような「完全情報ゲーム」と異なり、麻雀は四人零和有限不確定不完全情報ゲームに分類されます。ironna-blog.com

これを簡単に分解すると:

  • 四人:4人対戦のため、協力・裏切り・読み合いの多層性が加わる。
  • 零和:一人の得点が他3人の損失(合計ゼロ)。
  • 有限:牌が尽きるため必ず終了。
  • 不確定:牌の山がランダム(運要素)。
  • 不完全情報:他人の手牌が見えない(ブラフや推測が必要)。

これにより、運が絡む一方で長期的に期待値を積む戦略が勝敗を分ける不完全情報ゲームの極致となります。以下で、数式・雑学・業界話を交え解説します。

1. 麻雀の核心:期待値(EV)計算

麻雀の判断(何を切るか、リーチかダマか、攻めか守りか)は、全て期待値で決まります。期待値とは「各選択肢の確率×リターン」の合計で、短期の結果(ツモるか放銃か)ではなく長期平均を重視。note.com

基本数式

  EV=ipi×riEV = \sum_{i} p_i \times r_i
  • pip_i  : 事象
iiの確率
  • rir_i  : 事象
  iiのリターン(点棒変動)

雑学例:リーチかダマかのEV比較 東1局0点(子)、テンパイ時。リーチで和了率50%、平均打点5000点。放銃率10%(平均失点3000点)と仮定。

  • リーチEV: 0.5×5000+0.1×(3000)+0.4×0=17000.5 \times 5000 + 0.1 \times (-3000) + 0.4 \times 0 = 1700 
  • ダマEV: 0.3×4000+0.05×(2000)=10900.3 \times 4000 + 0.05 \times (-2000) = 1090  点(打点低め) → リーチ優位! ただし、親のベット状況で変わる。note.com

勝利の方程式(業界の定石): 「適切な放銃リスク管理をしつつ、両面待ち・高打点の手を作ってEVを積む」。放銃回避(防御EV↑)と和了追求(攻撃EV↑)のバランスが命。note.com

戦略 EV寄与 雑学
両面待ち重視 +高(有効牌多) 天鳳トップは平均有効牌4.2枚超
高打点狙い +中(リターン大) Mリーグ平均打点4000点超で勝率↑note.com
防御(ベタオリ) -低(機会損失) プロの放銃率5%未満が理想

2. ゲーム理論のキーワード:ナッシュ均衡とミニマックス

  • ナッシュ均衡:全員が「相手の戦略固定で自分の最適を選ぶ」状態。麻雀では「リーチ/ダマの混合戦略」(例: 良形70%リーチ、悪形30%ダマ)が均衡に近づく。雑学:ポーカーAI「Libratus」はこれで人間プロを撃破。麻雀AIも近似。note.comnote.com
  • ミニマックス戦略:最悪損失を最小化(ゼロサム向き)。麻雀では「ラス回避優先」で防御寄りだが、多人数ゆえ柔軟。note.com

Mリーグ業界話:固定メンツの繰り返し対局で「人読み」が効き、ナッシュ均衡が観測しやすい。打点重視が主流なのは利得支配的均衡:相手が高打点なら自分も高打点狙いが最適(速度重視は負けやすい)。2019シーズン、平均打点高い選手の勝率が上位独占。note.com

3. ブラフ・読みのゲーム理論

不完全情報ゆえベイズ推定(相手の手役確率更新)が鍵。リーチは「ブラフ可能」(ダマテン装い)。プロは「混合戦略」で予測不能に:例、Mリーガーのリーチ率調整で相手のオリ率を操作。note.com

ポーカー比較雑学:ポーカーは2人ヘッズアップ解析が進むが、麻雀4人は指数爆発(状態空間10^100超)。だから「運多め」と誤解されやすいが、プロの長期勝率差はEV思考の賜物。detail.chiebukuro.yahoo.co.jp

4. AI・現代業界の進化(雑学満載)

  • 麻雀AIのゲーム理論:Suphx/NAGAは強化学習でナッシュ均衡近似。人間プロ超え(天鳳特上位)。不完全情報をCNNで予測(手牌推定精度90%超)。note.com
  • 業界変革:Mリーグ(2018開始)はeスポーツ化。賞金総額10億円超、視聴率5%超。プロ34人、データ解析(EVツール)必須。梶本琢程プロら「理論派」が解説で人気。youtube.com
  • 未来予測:AI牌効率ツール普及で「人読みナッシュ」が主流に。雀荘減少中だが、オンライン(雀魂天鳳)でプレイヤー1000万人超。

麻雀は「運90%、実力10%」の俗説を覆すEV積立ゲーム。プロ如き河野高志氏も「ツキでタイトル取った」と謙遜するが、長期でEV+0.1%でも年収億超え可能。あなたもEV思考で挑めば、雑に強くなるぞ!@key_poker

麻雀は、ゲーム理論の観点から見ると**「不完全情報ゲーム」**の極致と言えます。チェスや将棋(完全情報ゲーム)とは異なり、相手の手牌や山にある牌が見えないため、不確実性の中での意思決定が求められるからです。

麻雀をゲーム理論で紐解きつつ、業界の裏話や雑学を交えて解説します。


1. 麻雀は「ゼロサム・ゲーム」である

ゲーム理論の基本ですが、麻雀は誰かが得点すれば誰かが失点する、合計が常にゼロになる**「ゼロサム・ゲーム」**です。

  • 理論のポイント: 自分がアガらなくても、他人のアガリを阻止する(放銃を避ける)ことは、相対的な期待値を守る行為になります。

  • 業界話: かつての麻雀界では「流れ」や「ツキ」という抽象的な概念が重視されていました。しかし、2000年代に「とつげき東北」氏などの**現代麻雀技術論(デジタル派)**が登場し、期待値や統計学に基づいた戦術が主流になりました。これにより、「運」を「確率と期待値」に置き換えて考える文化が定着したのです。

2. nash平衡(ナッシュ平衡)と「押し引き」

麻雀における最大の意思決定は**「押し(攻める)」か「引き(降りる)」か**です。

  • 理論のポイント: 相手がリーチをかけてきた際、自分のアガリ確率と打点、相手への放銃確率と失点リスクを天秤にかけます。全員が自身の利益を最大化しようとすると、一種のナッシュ平衡(これ以上戦略を変えても得をしない状態)に近い形に収束します。

  • 雑学: 現代の最強AI(SuphxやNAGAなど)は、この押し引きの判断が極めて正確です。プロ棋士でも迷うような局面で、AIは「数%の期待値の差」を根拠に、驚くほど大胆なオリ(ベタオリ)を選択することがあります。

3. 混合戦略と「ブラフ(三味線)」

ゲーム理論には、自分の行動を予測させないために確率で行動を変える**「混合戦略」**という考え方があります。

  • 理論のポイント: 常に「高い手」の時だけリーチを打つと、相手にすぐに見破られて降りられてしまいます。あえて安い手や待ちの悪い手でリーチを打つ(ブラフに近い行為)を混ぜることで、相手の判断を狂わせることができます。

  • 業界話: 実際の対面麻雀では、ため息をついたり、牌を強く切ったりする「三味線(嘘の情報を流す行為)」はマナー違反やルール違反とされることが多いです。しかし、ゲーム理論的には「情報の非対称性」を利用した高度な駆け引きの一部とも言えます。Mリーグなどのプロ対局では、こうした所作による情報伝達は厳しく制限されています。

4. 協力ゲームの側面(コンビ打ちと差し込み)

通常は個人戦ですが、状況によっては**「非協力ゲームの中の局所的協力」**が発生します。

  • 理論のポイント: オーラス(最終局)で、自分が2位、3位が僅差、1位が独走している場合。自分が2位を確定させるために、あえて4位(ラス)の人に安い手を振り込む(差し込む)ことで、1位の親番を終わらせる戦略があります。これは「共通の敵(対局の終了)」のために利害が一致する瞬間です。

  • 雑学: 昔の裏プロの世界を扱った漫画(『哲也』や『アカギ』など)では、コンビを組んで相手をハメる技術が登場しますが、現代のネット麻雀や競技麻雀では「コンビ打ち(共謀)」は最も重い不正(即BANや除名対象)とされています。


5. 麻雀特有の「レバレッジ」:ドラと裏ドラ

麻雀を複雑にしているのが**「ドラ」**という不確定要素です。

  • 理論のポイント: ドラは、期待値を一気に跳ね上げるレバレッジ(テコ)の役割を果たします。裏ドラの存在により、リーチという行為には「見えない期待値」が上乗せされており、これがゲームを「正解のないギャンブル」に仕立て上げています。

  • 業界話: 実は「裏ドラ」や「一発」というルールは、戦後の日本でゲームの回転率を上げ、ギャンブル性を高めるために普及した日本独自のルール(リーチ麻雀)です。中国の公式ルールには裏ドラはなく、より純粋なパズル的要素が強いのが特徴です。


まとめ:麻雀は「不運を最小化する」ゲーム

ゲーム理論的に言えば、麻雀は**「運というノイズがある中で、いかに長期的な期待値をプラスに収束させるか」**を競うゲームです。1局単位では初心者がプロに勝つこともありますが、1万局打てば必ず実力差(期待値の差)が明確に現れます。

「麻雀に流れはないが、理(り)はある」

これは現代麻雀の格言のようなものですが、まさにゲーム理論的な思考を象徴する言葉と言えるでしょう。


次の一手として、特定の状況(例えば「リーチを受けた時の具体的な押し引きの計算方法」など)について、より詳しく解説しましょうか?

0 件のコメント: