篠田 裕之(著)
※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。
【本書の対象読者】
・データサイエンティストを目指す学生
・データ分析に興味はあるが、あまり経験や知見がないデータ分析の初学者の方
【本書のポイント】
Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、
分析の準備から結果の考察、そして精度を上げるプロセスを
ステップバイステップでコードとともに、わかりやすく解説しています。
【本書より扱うコンペの特徴:本書より抜粋】
・Titanicコンペの特徴
乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、
生存したか死亡したかのフラグとともに与えられています。
生死に影響する属性の傾向をデータから分析して、
生死がわからない(予測用に隠されている)乗客について、
生死結果を予測することが目的です。
・House Pricesコンペの特徴
与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、
79個の説明変数および、目的変数としての物件価格を含みます。
1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、
1459戸の家の価格を予測します。
【著者プロフィール】
篠田 裕之(しのだ・ひろゆき)
広告会社で、ビッグデータを活用したメディアソリューション開発を行う。
データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。
【本書の概要】
本書はこれからデータ分析をはじめたいと思っている方や、Kaggleに興味のあるデータ分析の初心者に向けて、Pythonの実際のコードとともに丁寧に解説した書籍です。 データ分析で必要な一般的な知識とともに、Kaggleへチャレンジするフローや、Kaggleの初心者向けコンペへの取り組み方を紹介します。データ分析や機械学習の一端に触れ、実際に課題を解決するプロセスを体感できます。
【本書の対象読者】
【本書のポイント】
Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、分析の準備から結果の考察、そして精度を上げるプロセスをステップバイステップでコードとともに、わかりやすく解説しています。
【本書より扱うコンペの特徴:本書より抜粋】
・Titanicコンペの特徴
乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、生存したか死亡したかのフラグとともに与えられています。生死に影響する属性の傾向をデータから分析して、生死がわからない(予測用に隠されている)乗客について、生死結果を予測することが目的です。
・House Pricesコンペの特徴
与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、79個の説明変数および、目的変数としての物件売値を含みます。1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、1459戸の家の売値を予測します。
【著者プロフィール】
篠田 裕之(しのだ・ひろゆき)
広告会社で、ビッグデータを活用したメディアソリューション開発を行う。データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。
※紙の書籍と電子書籍でレイアウトが異なります。
Prologue:Kaggleで実践的なスキルを体験しよう!
Chapter1:Kaggleとは
Chapter2:データ分析の手順、データ分析環境の構築
Chapter3:Kaggleコンペにチャレンジ(1):Titanicコンペ
Chapter4:Kaggleコンペにチャレンジ(2):House Pricesコンペ
Chapter5:さらなるデータサイエンス⼒向上のためのヒント
Appendix:Kaggle Days ToKyo 2019 レポート
P.N.平日友 さん
2020-12-07
kaggleってどんなものか気になりざっと読了。環境構築の章があるので初めてでも土俵にあがれる。ただパイソンの知識がある程度必要。どんなふうに分析するのか概要がわかりコンペに参加するイメージがわいた。いろんな人のコードや知見を見ることができるのはなんと励みになることなのだろうか。早速タイタニック号の分析から始めて見ようと思う。
toji さん
2021-04-22
環境設定の方法から、課題提出までの過程を丁寧に書いてくれているので、そろそろ挑戦してみようと考えているものにとってはありがたい。また、課題にはないが、実業務で求められる分析(タイタニックの乗客の傾向分析など)も盛り込まれていて参考になった。