Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ぼくのかんがえたさいきょうのマリオAI

 ぼくのかんがえたさいきょうのマリオAI

Ushitora Anqou

December 10, 2018
Tweet

More Decks by Ushitora Anqou

Other Decks in Programming

Transcript

  1. いろんなやりかた • ルールベース • すたっとさんとか • つらそう • 遺伝的アルゴリズム •

    VT-b とか • つらそう • ヂープラニーング(DQN) • 梅さんとか • つらそう 6
  2. ところで • マリオ AI のステージは固定 • ランダム要素はない。 • エージェント出力の種類は有限 •

    6 個のボタンの ON/OFF なので 26 = 64 ⬇ 出力を全て決めればその評価は一定 9
  3. どゆこと? 事前にエージェントの出力を決める。 1. 右移動+ダッシュ 2. 右移動+ジャンプ 3. ジャンプ . .

    . これを出力した後の状態を評価すると、そ の出力の「よさ」が分かる ➡ 探索可能 10
  4. 続‧すくなく計算する 人間がマリオを遊ぶ。 • 人間の反応時間は 0.2s。 • 片や PC の画面更新は 30fps

    → 0.033s ➡ 人間のほとんどの反応は前と同じ 同様にエージェントの出力をダブらせる。 17
  5. 続‧評価関数をつくる • マリオの x 座標を使う? • 無謀にジャンプして距離を稼ぎ死ぬ。 • 袋小路に入って死ぬ。 •

    マリオの y 座標を使う? • ジャンプし続けて死ぬ。 • その他の指標? • わからん!w 23