Tit for Tat戦略を何故採用するかと、その欠点および改善についての雑感

雑記以上、考察未満。今朝、通勤中に云々あって感じたことのメモと派生。


いまだに自分はTit for Tat戦略(恩には恩を、怨には怨を)を採用している。今朝の出来事でそれを思い出し、どこぞで「それってあんまりよくないんじゃね」みたいな文を見たのを思い出したので、何故自分がこの戦略を採用してるのかを再び考えてみた。
Tit for Tat戦略は後手の戦略である。相手の直前の行動に基づいて自分の行動を決定する。これは、相手から見れば「前に取った行動への返答」と捉えることができる。そしてそれは学習の観点から見れば「前に取った行動の報酬」となり、「協力行為→報酬大」「裏切行為→報酬小」であるので、「協力行為」を選択するように学習させることができる。つまり、Tit for Tat戦略は相手の学習を操作する戦略であり、環境操作である。よって、自分は相手の「協力行為」を誘発するために採用しているのだと思われる。もちろんそんな自覚はなかったので、たぶん「環境操作に成功した」あるいは「操作された」という実感があり、その学習によってたどり着いたのではないかと推測する。


次に、Tit for Tat戦略の欠点について考える。今朝の出来事から考えるに、相手が「恨みは倍返し」戦略だった場合に足の引っ張り合いになり、永遠に損し続けるという欠点がある。そのゲームのプレイヤーだけ考えれば差は大きくないが、他のプレイヤーまで考えると明らかに損している。
このような事態は、相手がTit for Tat戦略を取っていた場合でも起こりうる。通常のTit for Tat戦略は「協力行為」から始まるが、現実世界においては選択肢は非対称であるので、「自分にとっての協力行為」が「相手にとっての裏切行為」になる可能性があるためである。
では、どのようにしてこの欠点を改善するかを考えてみると、「ゲームを終了する」という行為が考えられる。これは、「死んでゲームオーバー」という意味ではなく、「その人間と関わることを避ける」という行為に該当する。つまり、「協力するプレイヤーと関わる回数を多く」「裏切るプレイヤーと関わる回数を少なく」することで、損失を最小限に抑える戦略である。


////////////////


こっからはただの雑記。


「関わることを避ける」は「相手を攻撃して排除する」というのも含まれるなぁと思った。で、それならば「自分の信念のために単体であろうと攻撃する」というアレは「相手を排除することで、自分の損失となる状況を抑える」という意味もあるのかなぁと思った。でも、それは「損失」と呼ぶに値するのかが疑問なので、まだ違和感は解消しないまま。
もっと単純に「相手が裏切行為(自分に賛同しない)を選択したからこちらも裏切行為(相手への攻撃)を選択した」という風にも見れるな。それだと普通にTit for Tat戦略や「恨みは倍返し」戦略に該当するので多少は納得するが。


「恨みは倍返し」戦略は、わりと短期的かつ視野の狭い(そのゲームしか見てない)戦略だと思うけど、どの程度普及してるんだろうか。


とりあえず、Tit for Tat戦略に代わる戦略が欲しかったけど、改善案だけで十分なんとかなりそうなので、これで良しとしよう。せっかく精神状態が安定してるのに、普通のTit for Tat戦略だとアレが育って困る。