2012年9月13日 (木)

どんぐりを巡る攻防3

どんぐりの価値が4、喧嘩になったときの闘争のコストが1の場合、Aがどんぐりを要求しBがそれを拒否して喧嘩になる状態が強いナッシュ均衡となることが分かりました。強いナッシュ均衡はたとえば試行錯誤によるダイナミクスを仮定したときに漸近安定になる状態ですので、A、B両者が試行錯誤して行動を修正していった場合、A要求、B拒否で必ず喧嘩になる状態に至って安定することが予想されます。

これは喧嘩になったときの闘争のコストが比較的小さい場合の結果ですが、闘争のコストがもっと大きい場合はどうなるのでしょうか。例えば闘争のコストを3、あとの条件は<その2>と同じ(どんぐりの価値は4、A、Bが勝つ確率は等しくて1/2ずつ)として考えてみましょう。

今度は喧嘩になったときのAの利得は
  4×1/2-3=-1
となり、Bの利得も
  4×1/2-3=-1
となります。喧嘩になると両者とも何もしないときよりも損をします。

このときゲームの木は

         要求    拒否
      A  →  B  →  (-1、-1)  
   非要求↓   受諾↓
      (0、4)   (4、0)

となります。また、利得表で書くと

   A \ B | 拒 否  受 諾
  ------------------
    要 求  |-1、-1 4、0
    非要求  | 0、4  0、4

となります。今度はAが要求をしてきたときにBは拒否すると利得は-1、受諾すると利得は0となりますのでAの言うことをきいてどんぐりを引き渡す方が得になります。Bが要求を受諾するのならAは要求した方がしないより得ですからAが要求してBが受諾する展開になると予想されます。

利得表をみるとA要求、B受諾の組み合わせは強いナッシュ均衡(手を変えると損をする手の組み合わせ)であることが分かります。闘争のコストが大きい場合はAの要求をBが受諾することで、どんぐりは奪われてしまうものの闘争は回避されることになりそうです。

ただこの利得表にはもう一つナッシュ均衡があります。探してみてください。そうですA非要求、B拒否もナッシュ均衡になるんですよね。Bが拒否することを察知してAが要求を差し控える状態と解釈できますが、この状態から手を変えることでどちらも得をすることはできません。Aの方は手を変えると損をします。Bの方は拒否を受諾に変えても得はしませんが損もしません。Bの方が損はしませんのでA非要求、B拒否の組み合わせは強いナッシュ均衡ではなく普通のナッシュ均衡(強くはないナッシュ均衡)であることが分かります。このように闘争のコストが大きいときは、Bが拒否することを見越してAが要求しない状態もナッシュ均衡になります。このときどんぐりはBのもとに留まり、現実の闘争は回避されることになるでしょう。

上の利得表に現れたナッシュ均衡はこの二つです。どんぐりはAかBかいずれかの手に帰する一方で、AかBかのいずれかが譲ることで喧嘩は回避されることが予想されます。これが喧嘩のコストが増加したことの効果です。コストの高い行動が回避されるというのは分かりやすい話ですが、どんぐりの行方も気になりますね。AかBのいずれがどんぐりを手にするのでしょうか。

試行錯誤によるダイナミクスを仮定して調べてみると、Bが0.8以上の確率で拒否するつもりでAがそれほどどんぐりを欲しがらない状態からゲームを始めると「A:非要求、B:0.8以上の確率で拒否」の状態に至って安定します(リャプノフ安定という余り強くない安定状態です)。上記以外の状態からゲームを始めると「A:要求、B:受諾」の状態に至って安定します(漸近安定という強い安定状態になります)。どちらになるかは初期状態次第ですが、どうもAの方に分がありそうな結果ではあります。

ちなみに闘争のコストがもっと増えて例えば6になったとすると、利得表は

   A \ B | 拒 否  受 諾
  ------------------
    要 求  |-4、-4 4、0
    非要求  | 0、4  0、4

となります。このときは、Bが0.5以上の確率で拒否するつもりでAがそれほどどんぐりを欲しがらない状態からゲームを始めると「A:非要求、B:0.5以上の確率で拒否」のリャプノフ安定に至り、それ以外の状況から始めると「A:要求、B:受諾」の漸近安定に至ります。A、Bの両者が強力な武器を持っていたりして喧嘩になったときのコストが増すと、Bに分のある均衡に至りやすくなるといえるでしょう。同じことはどんぐりの価値が2になった場合にも生じます。わずかな資源を巡って喧嘩の危険を冒すのはAにとっても割りにあわないと解釈できます。

このように闘争のコストが増すか、資源の価値が低い場合にはAがどんぐりの要求を思いとどまってBがどんぐりを保持し、闘争のコストが小さかったり、資源の価値が高いときにはAがどんぐりを要求してBが譲ったり、喧嘩になったりしやすいといえるでしょう。弥生時代に入って資源の主体がどんぐりから稲に移ると、資源の価値があがり闘争が発生しやすくなると予想できます。実際、弥生時代になると武器によって負傷した人骨が発見される割合が増えるようです。

| | コメント (4) | トラックバック (0)

2012年9月11日 (火)

どんぐりを巡る攻防2

まずBさんが価値4のどんぐりを蓄えているとしましょう。そこにAさんが現れて、それを寄こすように要求する場面を考えることにします。縄文人っぽい名前にする手もあるのですが、どんな名前が縄文人っぽいのかよく分かりませんので、単にA、Bとしておきます。

Aの戦略は「要求する」か「要求しない」かの二つです。「要求しない」と話はそこで終わりでAの利得は0、Bの利得は4となります。これを(0、4)と書くことにします。

Aが「要求する」とBはどうするでしょうか。要求どおりどんぐりを渡してしまうかもしれませんし、拒否するかもしれません。あるいは半分渡す選択肢もあるかもしれませんが、簡単のためにBの戦略は「受諾」と「拒否」の二つだとしましょう。Bが「受諾」するとどんぐりはAに引き渡されますのでAの利得は4、Bの利得は0となります。(4、0)と表記できます。

Aが要求してBが拒否すると事態は風雲急をつげてきます。寄こせ、寄こさんの押し問答の末Aが攻撃をしかけるものとしましょう。Bも応戦して喧嘩になります。喧嘩の結末はケースバイケースでしょうけど、ざっくりいってある確率でAが勝ってどんぐりを手にするでしょうし、またある確率でBが勝ってどんぐりの防衛に成功するでしょう。ただしいずれが勝つにしても怪我のリスクを負うことになります。

ここでは一番簡単な場合としてどちらが勝つ確率も同じで1/2、どちらが勝つにしてもコスト1に相当するダメージを受けるものとしましょう。このとき、Aは確率1/2で価値4のどんぐりを手に入れますので期待利得は4×1/2=2ですが、1のダメージを受けるのでその分を差し引いて利得は2-1=1となります。Bの利得も同様に4×1/2-1=1なので、Aが要求してBが拒否したときの利得は(1、1)になると考えられます。

以上をゲームの木で表現すると

         要求    拒否
      A  →  B  →  (1、1)  
   非要求↓   受諾↓
      (0、4)   (4、0)

となります。また、利得表で書くと

   A \ B | 拒 否  受 諾
  ------------------
    要 求  | 1、1  4、0
    非要求  | 0、4  0、4

となります。ゲームの行方を考えてみると、Aがどんぐりを要求したときにBは受諾するより拒否したほうが得ですから、拒否すると考えられます。Bが拒否するとき、Aは要求しないと利得0で要求すると利得1ですから、Aは要求した方が得です。利得表をみるとAが要求、Bが拒否の組み合わせがナッシュ均衡になっています。ナッシュ均衡というのは、その状態から自分だけ手を変えても利得が増えないような手の組み合わせで、A要求、B拒否の組み合わせから手を変えてもどちらも利得は増えません。それどころかこの場合は手を変えると損をしてしまいます。手を変えると損をするような組み合わせを特に強いナッシュ均衡(strict Nash equilibrium)といいますが、この場合、A要求、B拒否が実現しやすいといえるでしょう。

上で考えたケースではAは常にどんぐりを要求してBがそれを拒否し、かならずどんぐりをめぐる喧嘩が発生すると予想されます。

| | コメント (0) | トラックバック (0)

どんぐりを巡る攻防1

1万2千年前ごろ以降、氷河期が終わって気候が温暖化すると、日本列島に広葉樹の森が広がりました。その中でもクヌギ、コナラやカシといったブナ科の植物は秋になると沢山のどんぐりをつけ、これが縄文時代の人々に利用されるようになりました。縄文人の摂取カロリーの約6割がどんぐりからだったという試算もあり、主食といってもよい存在だったようです。

このどんぐり、タンニンという苦味成分を含んでいるのでそのままでは苦くて食べられません。長時間水につけて虫を殺すとともにタンニンを抜いて乾燥させた状態で保存し、食べるときには石皿とすり石で粉にして土器で煮て食べるというのが縄文の人たちの利用法だったようです。縄文時代の遺跡では竪穴住居の中や外にどんぐりを大量に蓄えた貯蔵穴があったり、谷筋に水にさらしてアク抜きしたと思われる施設が見つかったりしています。秋に大量に採取したどんぐりが特に冬から春にかけての主食になったのでしょう。

この大事などんぐりを誰かに取られてしまうということはなかったのでしょうか。事実として貯蔵穴が沢山見つかるということは、それほど頻繁に取られることはなかったことを示唆しています。しょっちゅう取られてしまうのであれば、苦労して山から集めてわざわざ穴を掘って貯蔵したりはしないでしょうから。

それでも自分ではどんぐりを集める労力をかけずに誰かから奪って済ませようという不心得者が現れる可能性はあるでしょう。あるいはどんぐりを年貢として徴収しようとする支配者が現れるかもしれません。弥生時代以降になって水田稲作が始まると、稲を徴収する支配者が現れるようになりますし、戦国時代には刈田狼藉といって他人の育てた稲を勝手に刈ってしまう行為も行われました。縄文時代にはそういったことはなかったのかもしれませんが、それならばそれはなぜなのかというところに興味がもたれます。以下では、どんぐりを巡る仮想的な争いの場面を考えてゲーム理論的に分析することを試みてみましょう。

| | コメント (0) | トラックバック (0)

2012年9月 8日 (土)

貯蔵資源の所有権

定住生活を送るようになると家財道具が増え、ドングリの貯蔵や魚や肉の燻製の保存が行われるようになります。こうした貯蔵資源の所有権がどうなるのかというのはゲーム理論的には興味が持たれるところです。

竪穴住居内に貯蔵されているものであれば、とりあえず居住者のものといえるでしょうけど、貯蔵条件のいいところに共同で蓄えたケースもあるようで、そういう場合はどうなったのでしょう。収穫に参加しない人がフリーライドするという現象がおきそうです。

竪穴住居内に貯蔵した資源の拠出を求められる可能性もあります。現実にはあまりなかったかもしれませんが、それはなぜなのか、のちの年貢や納税の始まりと関連して興味がもたれるところです。

| | コメント (0) | トラックバック (0)

2012年9月 7日 (金)

定住生活のはじまり

日本の歴史01 『縄文時代の生活誌』岡村道雄 2002 を講談社学術文庫で読んでいます。10年ぐらい前の少し古い本ですがなかなか面白いですね。

寒冷な旧石器時代の遊動生活から、1万2000年ほど前に温暖な時代になると定住生活がはじまります。移動のコストが節約できるので定住生活の方が楽かとは思いますが、大型動物の狩りが主体で、植物性食品の層が薄かった旧石器時代には植物性の食べ物が不足して獲物が移動してしまうと、移動するしかありません。

温暖になり植物性の食べ物が豊富になると定住が可能になります。定住するとドングリなどの堅果類を割って食べるための石器や煮炊きするための土器を作って家に置いておくことができるようになります。さらに堅果を貯蔵する穴も家の中に掘ることができて食料の不足期にも移動しないですごすことも可能になります。

西アジアで自生小麦を食べるために石臼などを装備したナトゥフィアン文化の人たちも、定住生活に入って始めて重い石の道具類を使うことができるようになり、道具の充実が定住生活を支える好循環をもたらしたようです。定住生活には定住生活を強化する作用があって、一度定住生活に入ると遊動生活には戻りにくいラチェット(歯止め)がかかると考えられます。

ただ、最初の定住はこうした道具類の支えなしに始まったはずですからよほど条件の良いところで始まると予想されますが、考古学的な資料によると氷期が終わって最初にコナラなどの広葉樹が成立しはじめた鹿児島県南部で最初の縄文遺跡が発見されているようです。海の幸の力もあって土器や大きな石器を装備した縄文文化がこのあたりで始まったようです。

| | コメント (0) | トラックバック (0)

2012年9月 6日 (木)

また縄文

しばらく弥生時代の本を読んでたのですが、また縄文時代にさかのぼることにしました。いきつもどりつすることで理解が深まる部分もありますし、そもそも縄文時代は長いので簡単にひとくくりにできないんですよね。

| | コメント (0) | トラックバック (0)

2012年8月22日 (水)

[メモ]リーダーの進化

リーダーの進化については、これまで余り知られていない難しさがあるようですね。さっき計算したところでは、かなりケイオティックな挙動を示すようです。

| | コメント (0) | トラックバック (0)

2011年5月 9日 (月)

メソn人モデル

ぼちぼちモデル作りを再開してます。今日はメソn人のレギュレーターモデルの枠組みをつくってました。

レギュレーター(調節者)はサンクションの供給によって協力行動の維持をはかるプレーヤーです。今回はメソn人モデルですから、レギュレーターに対してさらにサンクションを与える上位レギュレーターを考えてメソn人協力の持続可能性を考えることになります。

この枠組みにそってゲームの三要素、プレーヤー、戦略、利得を定式化して均衡なりダイナミクスなりを考える予定です。利得の定式化が結構面倒ですが、これをやらないと先へ進まないので、少しずつ考えていきましょう。

| | コメント (0) | トラックバック (0)

2009年2月14日 (土)

調整ゲームのダイナミクス3

まず「北口か南口かどちらにいこうか」を考える場合のモデルをつくることにしましょう。

比較の対象となる選択肢は「北口」と「南口」で、「会える」か「会えない」かが選択肢の持つ主な属性となります。過去の経験やその他の周辺情報から「北口」を思い浮かべたときに「会える」気がする確率をp、「会えない」気がする確率を1-pとしましょう。一方、「南口」を思い浮かべたときに「会える」気がする確率をq、「会えない」気がする確率を1-qとします。

このとき、確率pqで「北口で会えて、南口で会えない」気がするのであなたは北口に向かうことになります。また、確率(1-p)(1-q)で「北口では会えなくて、南口で会える」気がするので、この場合は南口に向かうことになるでしょう。残りの場合は「どちらでも会えそうな気がする」か「どちらでも会えそうな気がしない」かいずれかになりますが、このときは迷ったあげく確率1/2で北口か南口かどちらかに向かうものとします。

このように考えると、あなたがたとえば北口に向かう確率は

  pq+1/2p(1-q)+1/2(1-p)q
 =1/2(p+1-q)

ということになります。これをxとおくことにしましょう。

同じように友人が北口に向かう確率を考えてこれをyとすることにします。すると確率xyであなたと友人は北口で会うことができて、めでたしめでたしとなるでしょう。このとき「北口で会える」という印象が強化されますから、「北口」を思い浮かべたときに「会える」気がする確率pが増加すると考えられます。

一方、確率x(1-y)であなたは北口、友人は南口にいってしまいすれ違いになります。このときは「北口で会えなかった」という印象が強化されますから、pは減ることになります。

同様に、確率(1-x)yであなたは南口に行って友人とすれ違います。このときは「南口で会えなかった」という印象が強化されますから、qが減少します。最後に確率(1-x)(1-y)であなたと友人は南口で会うことができますので、このときは「南口」で「会える気がする」確率qが増えることのなるでしょう。

ここでxが増えるのはpが増えるときかqが減るときですので、待ち合わせを1回したときにxが増える確率は

  xy+(1-x)y=y

となります。逆にxが減るのはpが減るかqが増えるときですのでxが減る確率は

  x(1-y)+(1-x)(1-y)=1-y

となります(まあ、単に1から引いた方がはやいですが)。

ここで、もしy>1-y、つまり

   y>1/2

ならxが増える確率の方が大きいのでxが増えやすい状況と考えられます。逆に

   y<1/2

なら今度はxが減りやすい状況ということになります。

友人も同じ方法で行き先を選んでいるものとするとx>1/2のときはyが増えやすい状況、x<1/2のときはyが減りやすい状況ということになるでしょう。

以上の結果を図示すると次のようになります。

  y
 1|
  | x増  x増
  | y減  y増
1/2
  | x減  x減
  | y減  y増
  +--------x
      1/2   1

これは、x=1、y=1に収束するかx=0、y=0に収束するかいずれかの結末にいたることダイナミクスになっています。x=1、y=1はあなたも友人も必ず北口にいくことを意味していますし、x=0、y=0はどちらも必ず南口に行くことを意味しています。このように、待ち合わせゲームを何回か繰り返すと、北口か南口かどちらかが「いつもの場所」となって特に打ち合わせをしなくてもいつも友人に出会えるようになると予想できます。慣習というものの成立メカニズムと考えることができるでしょう。

以上のように、確率的意思決定モデルをベースにして調整ゲームの試行錯誤型のダイナミクスを導くことができました。通常のゲーム理論や進化ゲーム理論でも同様の結論になりますので、とりあえずそれほどおかしくないモデルができたといえるでしょう。もちろん、いつも従来のモデルと同じ結果になるのであれば新しいモデルを立てる必要はないのですが、たとえば囚人のジレンマゲームについて分析してみますと多少従来のモデルとは違った結果になってきたりもします。その辺はまたおいおい書いていくことにしましょう。

とりあえず、今日はこの辺で。続きは旅行から帰ってきてからになります。

| | コメント (0) | トラックバック (0)

調整ゲームのダイナミクス2

確率的意思決定モデルは、それぞれの選択肢によい属性や悪い属性などのいくつかの属性があり、いずれかの属性が確率的に意識に上ることによって意思決定がなされると考えるモデルでした。以下では待ち合わせゲームを例にとって、この場合の意思決定をモデル化していくことにしましょう。

友人と駅の北口と南口のいずれかで待ち合わせする場合を考えることにします。折悪しく携帯電話は圏外かバッテリー切れか、あるいはミノフスキー粒子の影響かによって使えません。このときあなたは北口か南口か、どちらに向かうでしょうか。

友人が北口に向かった場合には、北口に行くと友人に会えますが、南口に行くと会えません。友人が南口に向かった場合には、南口に行くと会えますが、北口に行くと会えません。この状況を一覧表にすると次のようになります。

 自分\友人| 北口   南口
 ----------------
    北口 |会える  会えない
    南口 |会えない 会える

ここであなたは「さて、どちらにいったものか」と考えるかもしれませんし、「あいつはどちらにいくだろう」と考えるかもしれません。前者は直接どちらの戦略を採るかを考える思考方法ですし、後者は相手の採るであろう戦略から間接的に自分の採るべき戦略を考える思考方法です。前者は学習ダイナミクスのうち、試行錯誤ダイナミクスに相当しますし、後者は最適反応ダイナミクスに相当する考え方になります。実際の意思決定ではどちらの考え方も使われると思われますので、両方の場合についてモデルを立てていくことにしましょう。

| | コメント (0) | トラックバック (0)