DCS Laboratory 2
繰り返し囚人のジレンマゲーム

ラボ2を開始するにあたっての注意

ラボ2を開始する前に，講義ノートにある進化ゲーム(pdf形式)に目を通すこと．

ゲームの概要

囚人のジレンマゲームは以下の利得行列で規定される二人非協力非ゼロ和ゲームである．

  |  C  |  D  |
--+-----+-----+
  |   3 |   5 |
C |     |     |
  | 3   | 0   |
--+-----+-----+
  |   0 |   1 |
D |     |     |
  | 5   | 1   |
--+-----+-----+

上記の利得行列における戦略Cは協調(Cooperate)を，そしてDは裏切り (Deception)を意味している．「協調」と「裏切り」の意味は下記の説明を参照のこと．ラボ2では，このゲームを繰り返し行い可能な限り高い総利得をあげるプレイヤーのプログラムを作成することを目的とする．

まず，囚人のジレンマゲームの背景について説明する．囚人のジレンマゲームは，1950年頃 Merrill Flood と Melvin Dresher によって発案され，後に A.W. Tuckerによって定式化された二人プレーヤによるゲームである．このゲームが囚人のジレンマと呼ばれるゆえんは，それが以下に述べる様な状況をもとにして説明された事情による．

その状況とは，仮にあなたがもう一人の共犯者と何らかの犯罪を犯して，逮捕され，拘置されているとする．裁判を前にして二人は別々の独房に入れられている (二人の間に通信はないとする)．そこであなたのところへ検事がやってきて，ある取り引きを持ち掛ける．検事が言うには，その取り引きは共犯者にも持ちかけられているという(これは二人の犯罪者に共通の状況とする)．取り引きに関して検事が言った内容はおおよそ以下のようなことである．

「状況証拠からして，あなたが無実を主張しても，検事側はあなた達の有罪を証明して２年の刑にする自信がある．しかしあなたが罪を認めて，あなたの共犯容疑者の罪状をあばく証言をしてくれれば，検事側はあなたを無罪放免にする．その場合，共犯容疑者には５年の刑を求刑する．ただし両方とも自白した場合は４年の禁固刑はかたいだろう．」

この状況で，各プレーヤは協調(無実を主張すること)，もしくは裏切り(罪を認めること)という２つの選択肢をとることができる．互いに，相手が次にとる行動を知らないままに，自分の次の行動を選ばなくてはならない．両者が協調した場合の利得は双方にR，両者とも裏切った場合は双方にP，一方が協調し他方が裏切った場合は，協調した方にS，裏切った方にTの利得を与える．ここで各利得 T, R, P,S は T > R > P > S およびR > (T + S)/2 を満足するようにとる．最初に与えた利得行列は T = 5, R = 3, P = 1, S = 0　という具体的なケースで，これは囚人のジレンマゲームの一例である．

今回のラボでは，囚人のジレンマゲームをプレーするプレーヤプログラムを作成し，二人のプレーヤで囚人のジレンマゲームを繰り返し行い，総利得を競う．ゲームの繰り返し回数Nは不明である．
( 注意: 現在のプログラムでは繰り返し回数がデフォルトで200回になっているが，講義での実験時は回数を変更する(何回になるかはわからないものとする))．

　　また，今回の対戦では乱数によるエラーを導入し，各プレイヤが選択した戦略がある確率で反転してしまうこととする．エラー率は数%程度とし，それは以下で説明するゲーム管理プログラム(master.c)の中で扱われる．
( 注意: 現在のプログラムではエラー率が2，3%に設定されているが，講義での実験時は変更になる可能性がある)．各プレイヤプログラムはエラーの発生を制御することはできない．　このエラーがあることにより，ある回の対戦でプレイヤーが協調を選んだとしても，その意図に反して，実際には裏切りという戦略に転換されてしまうことがある．その逆もありうる．また，このエラーは，双方のプレイヤにある確率でランダムに生じる．

さて，このゲームを繰り返し行なう場合，それぞれどのような行動選択の戦略を取るべきか？どうしたらエラーからリカバーし泥仕合になることを避けられるか？相手の戦略決定メカニズムを推定するか学習することで優位な立場をとれるか？

諸注意

進化ゲーム(pdf形式)を読むと，TIT FOR TATというプログラムが紹介されているが，今回のラボではこのプログラムは禁止とする（TIT FOR TATをプログラムとして作成して提出しても成績はつかない）．また，常に裏切るとか常に協調する傾向にあるプログラム，また，講義で紹介した収益最大可原理や，時おり相手を裏切りような卑劣な戦略も禁止とする．つまり，オリジナルな戦略を考えること．
TIT-FOR-TATに関しては実際に，今回の対戦ではエラーが導入されているので，TIT FOR TATは必ずしも有効なプログラムとは言えない．また，乱数を使ってランダムに戦略を選ぶ，常に協調する，常に裏切るなどの単純なプログラムも禁止とする．エラーからのリカバリや相手の過去の戦略から戦略決定メカニズムを推定するなどの工夫が必要である．
12月20日は対面講義で，すべてのプログラムでリーグ戦を行う．リーグ戦の詳細は以下を参照のこと．
リーグ戦上位のプログラムに関しては，プログラム作成上のアイデアに関して簡単な発表をしてもらう予定．　
提出物はプログラム(ソースコード)，レポートである．これらの詳細は以下を参照のこと．
プログラム全体は，以下の規定にあるようにいくつかの関数に分割してプログラミングする．
ラボ2では，対戦の都合上，複数の関数をそれぞれ指定されたファイルにいれて，コンパイル・リンクする．どの関数をどの名前のファイルにいれるかの指定，そして複数のソースコードをコンパイルする方法は以下を参照すること．作成したすべてのソースコードはginga01.fun.ac.jpマシン上の "/export/home/Fun/DCS/2023/lab/2/<学籍番号>/" ディレクトリの下にコピーしておくこと．ソースコードのアクセス許可モードは644 (-rw-r--r--)とする．

提出物

以下のものを提出すること．

レポート
ソースコード

期限

プログラムとレポートは12月18日(月)の午後23時を提出期限とする．この時間までに指定されたディレクトリにプログラムをコピーしておくこと．さらにHOPEにレポートを提出すること．それ以降は指定されたディレクトリは書き込み不可能となり，HOPEへのレポート提出はできなくなる．．
提出の遅延は認められない．

ラボ2詳細 -プレイヤプログラムの作成-

ラボ課題2は，繰り返しゲームを管理するプログラム(master.c)，は提供されるもの(ginga01.fun.ac.jp上の/export/home/Fun/DCS/2023/resource/2/master.c)を用い，　 (1)戦略を決定するプレイヤプログラムを二つ (player1.c と player2.c)作る．player1.c と player2.cは，トップレベルの呼び出し関数がそれぞれ Player1()，Player2()　となっている違いがあるだけで，プログラム本体は同一でもよいし，本体が違っていてもよい(種類の異なる二つのプレイヤプログラムを作ってもよい)．このように二つのプログラム(ファイル)を作成するのは，リーグ戦の対戦の都合(一方がPlayer1関数，他方がPlayer2関数で戦うため)である．

ゲーム管理プログラム(master.c)(これは今回の課題では与えられるので作成する必要はないが，プレイヤプログラムを作成するためには読んでおく必要がある)
関数とファイル: 各関数の仕様については以下を参照すること．

関数の仕様

複数のソースコードファイルのコンパイルおよびオブジェクト(再配置可能形式，リロケータブルモジュール)とのリンク
複数のソースコードファイルのコンパイルおよびオブジェクト(再配置可能形式，リロケータブルモジュール)とのリンク: "master.c", "player1.c", "player2.c" の三つのソースコードは以下の方法でコンパイルできる．以下の例ではオブジェクト(実行可能形式，ロードモジュール)は "a.out" になる．
% gcc master.c player1.c player2.c; また，既にコンパイル済みのリロケータブルモジュール "player1.o" (gcc に "-c"オプションを与えることでリンケージエディタを起動しないようにして作成する) と，ソースコードの "master.c" そして "player2.c"は以下の方法でコンパイルできる．以下の例ではオブジェクト(実行可能形式)は "a.out" になる．
% gcc master.c player2.c player1.o; コンパイル時に警告がたくさん出て煩わしい場合は gcc に "-std=c99" というオプションを与えるとうまくいくかも知れない．

...Return

DCS LABページ

DCS Laboratory 2繰り返し囚人のジレンマゲーム

ラボ2を開始するにあたっての注意

ゲームの概要

諸注意

提出物

レポート

ソースコード

期限

ラボ2詳細 -プレイヤプログラムの作成-

ゲーム管理プログラム(master.c)(これは今回の課題では与え られるので作成する必要はないが，プレイヤプログラムを作成するために は読んでおく必要がある)

関数とファイル

関数の仕様

複数のソースコードファイルのコンパイルおよびオブジェクト(再配置可能形式，リロケータブルモジュール)とのリンク

プログラム作成およびコンパイル時の諸注意

...Return

DCS Laboratory 2
繰り返し囚人のジレンマゲーム

ゲーム管理プログラム(master.c)(これは今回の課題では与えられるので作成する必要はないが，プレイヤプログラムを作成するためには読んでおく必要がある)