翔泳社の公式通販SEshopは全国送料無料!
ヘルプ 新規会員登録 ログイン
SEshop

現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御

伊藤 多一(著) , 今津 義充(著) , 須藤 広大(著) , 仁ノ平 将人(著) , 川﨑 悠介(著) , 酒井 裕企(著) , 魏 崇哲(著)

商品番号
159920
販売状態
発売中
納品形態
宅配便にてお届け
発売日
2019年08月07日
出荷開始日
2019年08月06日
ISBN
9784798159928
判型
A5
ページ数
328
キーワード
アルゴリズム  人工知能  深層学習  AI & TECHNOLOGY

3,740円(税込)(本体3,400円+税10%)
送料無料

340pt (10%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

電子書籍はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

注目の最新AI技術!深層強化学習の開発手法がわかる!
第一線で活躍する著者陣の書下ろしによる待望の1冊!

【本書の目的】
AlphaGo(アルファ碁)でも利用されている深層強化学習。
AIサービスのみならずロボティクス分野でもその応用が期待されています。
本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

【本書の特徴】
第1部では、まず、深層強化学習の概要について説明します。
次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。
さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。
第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。
1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。
2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。
3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。

全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

【読者が得られること】
深層強化学習による開発手法を学ぶことができます。

【対象読者】
深層強化学習を学びたい理工学生・エンジニア

深層強化学習のアルゴリズムからAI開発手法を徹底解説!

本書は2部構成で深層強化学習による開発手法を学ぶことができます。

Part1基礎編

Part1では、深層強化学習の基礎となるアルゴリズムを解説し、簡単な事例(倒立振子制御)について実装例と検証結果を紹介します。

Part2応用編

Part1で紹介されたアルゴリズムを具体的な課題に適用します。特に強化学習の数ある手法の中でも幅広い応用が期待される方策ベースの手法を取り上げ、制御を担うエージェントの実装と学習について詳しく解説します。

サンプルはダウンロード提供

本書で使用するサンプルは翔泳社のサイトでダウンロードできます。

■Part 1 基礎編

CHAPTER 1 強化学習の有用性
 1.1 機械学習の分類
 1.2 強化学習でできること
 1.3 深層強化学習とは

CHAPTER 2 強化学習のアルゴリズム
 2.1 強化学習の基本概念
 2.2 マルコフ決定過程とベルマン方程式
 2.3 ベルマン方程式の解法
 2.4 モデルフリーな制御

CHAPTER 3 深層学習による特徴抽出
 3.1 深層学習
 3.2 畳み込みニューラルネットワーク(CNN)
 3.3 再帰型ニューラルネットワーク(RNN)

CHAPTER 4 深層強化学習の実装
 4.1 深層強化学習の発展
 4.2 行動価値関数のネットワーク表現
 4.3 方策関数のネットワーク表現

■Part 2 応用編

CHAPTER 5 連続制御問題への応用
 5.1 方策勾配法による連続制御
 5.2 学習アルゴリズムと方策モデル
 5.3 連続動作シミュレータ
 5.4 アルゴリズムの実装
 5.5 学習結果と予測制御

CHAPTER 6 組合せ最適化への応用
 6.1 組合せ最適化への応用について
 6.2 巡回セールスマン問題
 6.3 ルービックキューブ問題
 6.4 まとめ

CHAPTER 7 系列データ生成への応用
 7.1 SeqGANによる文章生成
 7.2 ネットワークアーキテクチャの探索

APPENDIX 開発環境の構築
 AP1 ColaboratoryによるGPUの環境構築
 AP2 DockerによるWindowsでの環境構築

各種問い合わせは以下のリンクからご連絡ください

感想・レビュー

kaida6213 さん

2021-11-06

入門と冠しているが中々難しい内容。他の本で基礎を学んでから読んでみると、非常にコンパクトに情報がまとまっていて良書だと感じた。後半半分以上最近の事例や応用事例なのも新しい知識を得られてマル。

アボカド さん

2019-11-30

第2章の理論が難解だが,コピー用紙にメモしながら理解すれば何とかなるが,それでも結構難しい。強化学習を始めて学ぶひとは,”ロボットインテリジェンス”という本をお勧めする。これはExcelVBAを使った強化学習解説本で基本のQ学習を理解できる。

関連商品

おうちで学べる Pythonのきほん

2,420円(税込)

2024.05.20発売

おうちで学べる Pythonのきほん【PDF版】

2,420円(税込)

2024.05.20発売

おすすめ特集

法人・教育機関のお客様へ

【法人・教育機関のお客様へ】新年度の大口注文・お見積りなど、お気軽にご相談ください

Webデザイン特集

デザインやコーディングなど、Webデザインに役立つスキルが身につく書籍を揃えました

生成AI特集

テキスト生成、画像生成、動画生成など、生成AI活用のスキルが身につく本をご紹介

新社会人におすすめの本

新社会人の役に立つスキルが身につく本。ビジネスパーソンとしてスタートダッシュを切ろう!

プログラミング教育の本

小学校から必修化!人気の『ルビィのぼうけん』ほかプログラミング教育の本はこちら

翔泳社のセミナー・講座

開発・ビジネス・マーケティング・EC運営・営業支援など、幅広いジャンルの講座を開催

特集をもっと見る