Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
[B! dqn] kuyのブックマーク
[go: Go Back, main page]

タグ

dqnに関するkuyのブックマーク (2)

  • お手軽にゲームプレイAIを試してみる - ABAの日誌

    最近はゲームAIがプレイしてくれる時代だ。 ゲーム攻略で人間を超えた人工知能、その名は「DQN」 有名なDQN。フルネームはdeep Q-networkと呼ばれる強化学習の一種だ。こういう機械学習系の仕組みはマシンパワーでもって学習をぶん回して動かさないといけないので、それなりの準備が必要なのが普通だ。だけど最近はこの手の物をブラウザ上で簡単に試せるようになっている。 REINFORCEjs 例えばREINFORCEjs。これはDQNをJavaScriptで実装したもの。使い方もえらく簡単。 // DQNエージェントにゲームの状態を与えると var action = agent.act(state); // アクションとしてどう行動すればよいかが帰ってくるので // それに従って行動して // その行動が正しかったどうかを示す報酬をDQNエージェントに教える agent.learn(re

    お手軽にゲームプレイAIを試してみる - ABAの日誌
    kuy
    kuy 2016/12/05
  • DQNの生い立ち + Deep Q-NetworkをChainerで書いた - Qiita

    はじめに そもそもDQNが作りたかったわけじゃなくて、他の目的でChainerを使いたかったのでその練習にDQNを書いたんですが、せっかくだし公開しようと思いました 公開しました 。またどうせ公開するなら、この機会にこれ(Q学習+関数近似)関連で持っている知識をついでに整理しようと思ってまとめました。 ニュース記事とかNatureとかNIPSの論文だけ読むと、DQN作ったDeepmind/Googleすげー!!!って感覚になりそうですが、強化学習的な歴史的経緯を考えると強化学習+深層学習になった、むしろかなり当然の成り行きで生まれた技術であることがわかります。(ATARIのゲームを人間以上のパフォーマンスでプレイするというのがビジュアル的にわかりやすかった$\leftrightarrow$問題設定が良かったというのもあります。) この記事ではNIPSとNatureの以下の2の論文 ・ V

    DQNの生い立ち + Deep Q-NetworkをChainerで書いた - Qiita
  • 1