【本書の概要】
本書は学術論文(NatureやGoogleのサイト)などで提供されている難解なアルファ碁およびアルファ碁ゼロの仕組みについて、
著者がとりまとめ、実際の囲碁の画面を見ながら、
アルファ碁およびアルファ碁ゼロで利用されている深層学習や強化学習の仕組みについてわかりやすく解説した書籍です。
特にデュアルネットワークはまったく新しい深層学習の手法で国内外の技術者の関心を集めています。
本書を読むことで、最新AIの深層学習、強化学習の仕組みを知ることができ、
自身の研究開発の参考にできます。また著者の開発したDeltaGoを元に実際に囲碁AIを体験できます。
【増補改訂のポイント】
Chapter1から5の部分は、よりわかりやすく内容を加筆修正しています。
またChapter6はアルファ碁ゼロに対応しています。
改訂にあたり、色数も2Cに変更。よりわかりやすいビジュアルになっています。
【対象読者】
人工知能関連の開発者、研究者
【著者プロフィール】
大槻知史(おおつき・ともし)
2001年東京大学工学部計数工学科卒業。2003年同大学院新領域創成科学研究科複雑理工学専攻修士課程修了。
以降、機械学習・最適化などの研究開発に取り組む。ゲームAIプログラマとしては、2001年より、囲碁・将棋プログラムの開発に従事。
著者の開発した将棋プログラム「大槻将棋」は、2009年世界コンピュータ将棋選手権にて第2位。博士(情報理工学)。
【監修者プロフィール】
三宅陽一郎(みやけ・よういちろう)
デジタルゲームの人工知能の開発者。京都大学で数学を専攻、大阪大学大学院物理学修士課程、
東京大学大学院工学系研究科博士課程を経て、人工知能研究の道へ。
ゲームAI開発者としてデジタルゲームにおける人工知能技術の発展に従事。
国際ゲーム開発者協会日本ゲームAI専門部会設立(チェア)、日本デジタルゲーム学会理事、芸術科学会理事、人工知能学会編集委員。
共著『デジタルゲームの教科書』『デジタルゲームの技術』『絵でわかる人工知能』(SBクリエイティブ)、
著書『人工知能のための哲学塾』(BNN新社)、『人工知能の作り方』(技術評論社)、
『ゲーム、人工知能、環世界』(現代思想、青土社、2015年12月)、
最新の論文は『デジタルゲームにおける人工知能技術の応用の現在』(人工知能学会誌 2015年、学会Webにて公開)。
特典として、本書で登場する主だった用語を掲載しました。本書を読む 上で活用してください。
はじめに
監修者のことば
本書の対象読者とダウンロードファイルについて
囲碁AIの歴史
対局レポート:アルファ碁と世界ナンバーワン棋士・柯傑九段の最終決戦
Chapter1 アルファ碁の登場
01 ゲームAIの歴史と進歩
02 天才デミス・ハサビスの登場
03 アルファ碁の活躍
04 囲碁AIの基礎
05 まとめ
Chapter2 ディープラーニング~囲碁AIは瞬時にひらめく~
本章で説明する技術トピックと、全体の中の位置づけ
01 ディープラーニングとは
02 手書き数字認識の例
03 アルファ碁における畳み込みニューラルネットワーク
04 ChainerでCNNを学習させてみる
05 まとめ
Chapter3 強化学習~囲碁AIは経験に学ぶ~
本章で説明する技術トピックと、全体の中の位置づけ
01 強化学習とは
02 強化学習の歴史
03 多腕バンディット問題
04 迷路を解くための強化学習
05 テレビゲームの操作獲得のための強化学習
06 アルファ碁における強化学習
07 まとめと課題
Chapter4 探索~囲碁AIはいかにして先読みするか~
本章で説明する技術トピックと全体の中の位置づけ
01 2人ゼロ和有限確定完全情報ゲーム
02 ゲームにおける探索
03 従来のゲーム木探索(ミニマックス木探索)
04 囲碁におけるモンテカルロ木探索
05 モンテカルロ木探索の成功要因と課題
06 まとめ
Chapter5 アルファ碁の完成
01 アルファ碁の設計図
02 非同期方策価値更新モンテカルロ木探索(APV-MCTS)
03 大量のCPU・GPUの利用
04 アルファ碁の強さ
Chapter6 アルファ碁からアルファ碁ゼロへ
01 はじめに
02 アルファ碁ゼロにおけるディープラーニング
03 アルファ碁ゼロにおけるモンテカルロ木探索
04 アルファ碁ゼロにおける強化学習
05 アルファ碁ゼロの強さ
06 アルファ碁ゼロは知識ゼロから作られたのか?
07 アルファ碁やアルファ碁ゼロに弱点はあるのか?
08 アルファ碁ゼロの先の未来
Appendix1 数式について
01 畳み込みニューラルネットワークの学習則の導出
02 強化学習の学習則の導出
Appendix2 囲碁プログラム用のUIソフト「GoGui」およびGoGui用プログラム「DeltaGo」の利用方法
01 DeltaGoとは
02 GoGuiのインストールとGoGui用プログラム「DeltaGo」の利用方法
おわりに
INDEX
kochi さん
2019-01-31
世界ナンバーワン棋士のイ・セドルをして「囲碁の神様」と言わせしめたアルファ碁がどのようにゲームを進めるのかについて、比較的わかりやすく解説。基本は画像認識の技術を応用して盤面を読み込み、人間の対局データや自身との対戦で勝ちにつながる次の一手を学習することにより勝てる確率が高い手を打つらしい。この認識・学習の部分にニューラルネットワークの深層学習が使われていて、グーグルの多大な計算機資源をつぎ込んで、足し算と掛け算を気の遠くなるほど繰り返した結果と考えると、まあこんなものか^_^
やすほ さん
2021-01-02
【☆☆☆☆☆】 世界一の棋士・柯潔九段に勝利した囲碁AI・アルファ碁についての論文の解説本。囲碁もAIも少しかじった程度だが、とても興味深く一気に読み終えてしまった。AIと言っても複雑なモデルに膨大なデータを学習させたパラメータチューニングであり、人間の工夫とリソースが不可欠だと感じた。AIが全て自分で考えて進化すると言う未来はもう少し先らしい。ただ、ゲームのように特定のタスクを与えられると人間のトップにも勝てるようになったと言うことなので、素晴らしい技術進歩だと思う。
じんじょ さん
★★★★★