コミッカ
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用

強化学習アルゴリズム入門 「平均」からはじめる基礎と応用

(1)
オーム社
2019/06/07
この作品の新刊予報
新刊の発売日は未定のようです...
最新刊は2019年06月07日に発売されました
他の作品を検索

最新刊

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 「平均」という観点から強化学習の基本が理解できる! AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。 本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。 また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社と著者のWebサイト、およびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。 【本書の特徴】 ・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説します。 ・さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較します。 ・PythonとMATLAB、2種類のコードを配布します。 ※Pythonのバージョンは3です。 第1章 平均から学ぶ強化学習の基本概念 第2章 各アルゴリズムの特徴と応用 第3章 関数近似手法 第4章 深層強化学習の原理と手法

この著者の作品
2

オーム社の作品
12

注目の新刊予報
4

異世界のんびり農家

(剣 康之/内藤 騎之介/やすも / KADOKAWA)
次巻の発売日:2025年1月9日ごろ

1日外出録ハンチョウ

(上原求/新井和也/萩原天晴/福本伸行 / 講談社)
次巻の発売日:2025年1月5日 ~ 2025年4月5日

黙示録の四騎士

(鈴木央 / 講談社)
黙示録の四騎士(18)(2024年09月17日)
次巻の発売日:12月17日ごろ

人気の作品
8