翔泳社の公式通販SEshopは全国送料無料!
ヘルプ 新規会員登録 ログイン
SEshop

Pythonで動かして学ぶ!Kaggleデータ分析入門

篠田 裕之(著)

商品番号
165230
販売状態
発売中
納品形態
宅配便にてお届け
発売日
2020年10月22日
出荷開始日
2020年10月21日
ISBN
9784798165233
判型
A5
ページ数
368
キーワード
Python  ビッグデータ  データ分析  AI & TECHNOLOGY

2,860円(税込)(本体2,600円+税10%)
送料無料

260pt (10%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

電子書籍はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

世界最大のデータ分析コンペサイト
Kaggle(カグル)に挑戦して
データ分析の基礎知識を身に付けよう!

【本書の概要】
本書はこれからデータ分析をはじめたいと思っている方や、
Kaggleに興味のあるデータ分析の初心者に向けて、
Pythonの実際のコードとともに丁寧に解説した書籍です。
データ分析で必要な一般的な知識とともに、
Kaggleへチャレンジするフローや、
Kaggleの初心者向けコンペへの取り組み方を紹介します。
データ分析や機械学習の一端に触れ、
実際に課題を解決するプロセスを体感できます。

【本書の対象読者】
・データサイエンティストを目指す学生
・データ分析に興味はあるが、あまり経験や知見がないデータ分析の初学者の方

【本書のポイント】
Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、
分析の準備から結果の考察、そして精度を上げるプロセスを
ステップバイステップでコードとともに、わかりやすく解説しています。

【本書より扱うコンペの特徴:本書より抜粋】
・Titanicコンペの特徴
乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、
生存したか死亡したかのフラグとともに与えられています。
生死に影響する属性の傾向をデータから分析して、
生死がわからない(予測用に隠されている)乗客について、
生死結果を予測することが目的です。

・House Pricesコンペの特徴
与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、
79個の説明変数および、目的変数としての物件価格を含みます。
1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、
1459戸の家の価格を予測します。

【著者プロフィール】
篠田 裕之(しのだ・ひろゆき)
広告会社で、ビッグデータを活用したメディアソリューション開発を行う。
データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。

世界最大のデータ分析コンペサイト Kaggle(カグル)に挑戦して データ分析の基礎知識を身に付けよう!

世界最大のデータ分析コンペサイト Kaggle(カグル)に挑戦して データ分析の基礎知識を身に付けよう!

【本書の概要】

本書はこれからデータ分析をはじめたいと思っている方や、Kaggleに興味のあるデータ分析の初心者に向けて、Pythonの実際のコードとともに丁寧に解説した書籍です。 データ分析で必要な一般的な知識とともに、Kaggleへチャレンジするフローや、Kaggleの初心者向けコンペへの取り組み方を紹介します。データ分析や機械学習の一端に触れ、実際に課題を解決するプロセスを体感できます。

【本書の対象読者】

  • データサイエンティストを目指す学生
  • データ分析に興味はあるが、あまり経験や知見がないデータ分析の初学者の方

【本書のポイント】

Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、分析の準備から結果の考察、そして精度を上げるプロセスをステップバイステップでコードとともに、わかりやすく解説しています。


【本書より扱うコンペの特徴:本書より抜粋】

・Titanicコンペの特徴

乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、生存したか死亡したかのフラグとともに与えられています。生死に影響する属性の傾向をデータから分析して、生死がわからない(予測用に隠されている)乗客について、生死結果を予測することが目的です。

・House Pricesコンペの特徴

与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、79個の説明変数および、目的変数としての物件売値を含みます。1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、1459戸の家の売値を予測します。


【著者プロフィール】

篠田 裕之(しのだ・ひろゆき)

広告会社で、ビッグデータを活用したメディアソリューション開発を行う。データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。


※紙の書籍と電子書籍でレイアウトが異なります。

PROLOGUE Kaggleで実践的なスキルを体験しよう!
0.1 Kaggleの世界に飛び込んでみよう!

CHAPTER 1 Kaggleとは
1.1 世界中のデータサイエンティストが競い合うプラットフォーム
1.2 Kaggleにおけるメダル、称号
1.3 コンペに参加する流れ
1.4 コンペの種類
1.5 Kaggleコミュニティについて

CHAPTER 2 データ分析の手順、データ分析環境の構築
2.1 データ分析の手順・概要
2.2 データ分析の環境について
2.3 Jupyter Notebookによる対話的なデータ分析環境について
2.4 Anacondaの仮想環境を利用する(Windows)
2.5 pyenvの環境を利用する(macOS)
2.6 Kaggleの環境を利用する

CHAPTER 3 Kaggleコンペにチャレンジ1:Titanicコンペ
3.1 Kaggleを通して実際のデータ分析フローに触れる
3.2 Titanicコンペとは
3.3 データを取得する
3.4 データ分析の準備をする
3.5 データの概要を把握する
3.6 データを可視化する
3.7 前処理・特徴量の生成を行う
3.8 モデリングを行う
3.9 Kaggleに結果をsubmitする
3.10 精度以外の分析視点

CHAPTER 4 Kaggleコンペにチャレンジ2:House Pricesコンペ
4.1 より詳細なデータ分析へ
4.2 House Pricesコンペとは
4.3 データを取得する
4.4 ベースライン(ベンチマーク)を作成する
4.5 目的変数の前処理:目的変数の分布を確認する
4.6 説明変数の前処理:欠損値を確認する
4.7 外れ値を除外する
4.8 説明変数の確認:特徴量を生成する
4.9 ハイパーパラメータを最適化する
4.10 様々な機械学習手法によるアンサンブル
4.11 追加分析(1)統計手法による家のクラスタ分析を行う
4.12 追加分析(2)ハイクラスな家の条件を分析・可視化する

CHAPTER 5 さらなるデータサイエンス力向上のためのヒント
5.1 Kaggle Masterへの特別インタビュー(wrb0312さん)
5.2 KaggleでオススメのStarter Notebook
5.3 GCPのAI Platformによる分析手順

APPENDIX Kaggle Days Tokyo 2019 レポート
A.1 Kaggle Days Tokyo 2019
A.2 専業Kagglerの1年半&LANL Earthquake Prediction 3rd place solution

各種問い合わせは以下のリンクからご連絡ください

感想・レビュー

P.N.平日友 さん

2020-12-07

kaggleってどんなものか気になりざっと読了。環境構築の章があるので初めてでも土俵にあがれる。ただパイソンの知識がある程度必要。どんなふうに分析するのか概要がわかりコンペに参加するイメージがわいた。いろんな人のコードや知見を見ることができるのはなんと励みになることなのだろうか。早速タイタニック号の分析から始めて見ようと思う。

toji さん

2021-04-22

環境設定の方法から、課題提出までの過程を丁寧に書いてくれているので、そろそろ挑戦してみようと考えているものにとってはありがたい。また、課題にはないが、実業務で求められる分析(タイタニックの乗客の傾向分析など)も盛り込まれていて参考になった。

関連商品

おうちで学べる Pythonのきほん

2,420円(税込)

2024.05.20発売

おうちで学べる Pythonのきほん【PDF版】

2,420円(税込)

2024.05.20発売

おすすめ特集

法人・教育機関のお客様へ

【法人・教育機関のお客様へ】新年度の大口注文・お見積りなど、お気軽にご相談ください

Webデザイン特集

デザインやコーディングなど、Webデザインに役立つスキルが身につく書籍を揃えました

生成AI特集

テキスト生成、画像生成、動画生成など、生成AI活用のスキルが身につく本をご紹介

新社会人におすすめの本

新社会人の役に立つスキルが身につく本。ビジネスパーソンとしてスタートダッシュを切ろう!

プログラミング教育の本

小学校から必修化!人気の『ルビィのぼうけん』ほかプログラミング教育の本はこちら

翔泳社のセミナー・講座

開発・ビジネス・マーケティング・EC運営・営業支援など、幅広いジャンルの講座を開催

特集をもっと見る