現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御【PDF版】

翔泳社(出版社) , 伊藤多一(著) , 今津義充(著) , 須藤広大(著) , 仁ノ平将人(著) , 川﨑悠介(著) , 酒井裕企(著) , 魏崇哲(著)

商品番号
161430
販売状態
発売中
納品形態
会員メニューよりダウンロード
発売日
2019年08月07日
ISBN
9784798161433
データサイズ
約20.7MB
制限事項
印刷可・テキストのコピー可
キーワード
アルゴリズム  人工知能  電子書籍【PDF版】  深層学習  AI & TECHNOLOGY

販売価格:¥3,740(税込)

ポイント:340pt (10%)
詳細はこちら

送料無料 在庫あり

[重要] 消費税率の変更について

紙の書籍を見る
ほしい物リストに追加
  • 本製品は電子書籍【PDF版】です。
  • ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
    PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
    Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
  • 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
  • ご購入の前に必ずこちらをお読みください。

注目の最新AI技術!深層強化学習の開発手法がわかる!
第一線で活躍する著者陣の書下ろしによる待望の1冊!

【本書の目的】
Alpha Go(アルファ碁)でも利用されている深層強化学習。
AIサービスのみならずロボティクス分野でもその応用が期待されています。
本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

【本書の特徴】
第1部では、まず、深層強化学習の概要について説明します。
次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。
さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。
第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。
1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。
2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。
3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。

全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

【読者が得られること】
深層強化学習による開発手法を学ぶことができます。

【対象読者】
深層強化学習を学びたい理工学生・エンジニア

PDF版のご利用方法

  1. ご購入後、SEshopにログインし、会員メニューに進みます。
  2. ご購入電子書籍およびデータ > [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
  3. 購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
  4. PDF形式のファイルを、お好きな場所に保存してください。
  5. 端末の種類を問わず、ご利用いただけます。

■Part 1 基礎編

CHAPTER 1 強化学習の有用性
 1.1 機械学習の分類
 1.2 強化学習でできること
 1.3 深層強化学習とは

CHAPTER 2 強化学習のアルゴリズム
 2.1 強化学習の基本概念
 2.2 マルコフ決定過程とベルマン方程式
 2.3 ベルマン方程式の解法
 2.4 モデルフリーな制御

CHAPTER 3 深層学習による特徴抽出
 3.1 深層学習
 3.2 畳み込みニューラルネットワーク(CNN)
 3.3 再帰型ニューラルネットワーク(RNN)

CHAPTER 4 深層強化学習の実装
 4.1 深層強化学習の発展
 4.2 行動価値関数のネットワーク表現
 4.3 方策関数のネットワーク表現

■Part 2 応用編

CHAPTER 5 連続制御問題への応用
 5.1 方策勾配法による連続制御
 5.2 学習アルゴリズムと方策モデル
 5.3 連続動作シミュレータ
 5.4 アルゴリズムの実装
 5.5 学習結果と予測制御

CHAPTER 6 組合せ最適化への応用
 6.1 組合せ最適化への応用について
 6.2 巡回セールスマン問題
 6.3 ルービックキューブ問題
 6.4 まとめ

CHAPTER 7 系列データ生成への応用
 7.1 SeqGANによる文章生成
 7.2 ネットワークアーキテクチャの探索

APPENDIX 開発環境の構築
 AP1 ColaboratoryによるGPUの環境構築
 AP2 DockerによるWindowsでの環境構築

各種問い合わせは以下のリンクからご連絡ください

関連商品

事例で学ぶ!あたらしいデータサイエンスの教科書

販売価格:2,420円(税込)

2019.12.17発売

情報処理教科書 情報処理安全確保支援士 2020年版【PDF版】

販売価格:3,168円(税込)

2019.11.19発売

心理教科書 公認心理師 完全合格問題集 2020年版【PDF版】

販売価格:3,080円(税込)

2019.11.18発売

おすすめ特集

今月のクーポン

翔泳社の通販SEshopなら全品送料無料、ポイント還元、さらに毎月更新の割引クーポンでお得!

ITインフラ関連本特集

【PDF版高額書籍フェア】売れ筋のハイエンドPDF版書籍を厳選し、40%ポイント還元!

情報処理教科書シリーズ

情報処理技術者試験におすすめの参考書「EXAMPRESS 情報処理教科書シリーズ」で最短合格!

起業に役立つ技術書特集

【起業に役立つ技術書特集】Webサービスを始め、副業やスモールビジネスにオススメの技術書をご案内。

アジャイル・スクラム関連本特集

アジャイル・スクラム入門書からプロフェッショナル向け開発書、チームマネジメント論まで。

Python特集

【今からはじめるPython特集】おすすめ本を入門~上級までレベル別にご紹介!

特集をもっと見る