Apache Spark徹底入門【PDF版】

5点すべての画像を見る

Jules S. Damji（原著） , Brooke Wenig（原著） , Tathagata Das（原著） , Denny Lee（原著） , 長谷川亮（翻訳） , 弥生隆明（翻訳） , 北村匡彦（翻訳） , 竹下俊一郎（翻訳） , 小谷尚太郎（翻訳） , 北岡早紀（翻訳） , 市村幸一郎（翻訳） , 永里洋（翻訳） , 野上将嗣（翻訳）

商品番号: 186780
販売状態: 発売中
納品形態: 会員メニューよりダウンロード
発売日: 2024年04月12日
ISBN: 9784798186788
データサイズ: 約31.0MB
キーワード: 電子書籍【PDF版】データ分析徹底入門シリーズ
制限事項: 印刷可・テキストのコピー可

PDFの利用制限について

PDFの利用制限は商品ごとに異なります。
上記の「制限事項」欄をご確認ください。

印刷可・テキストのコピー可
Adobe Acrobat Reader などのPDF閲覧アプリで、問題なくご利用いただけるケースが多く確認されています。
※すべてのアプリでの動作を保証するものではありません。
印刷不可・テキストのコピー不可
「編集・印刷・コピー禁止」などの制限が設定されています。一部のアプリでは、読み込み時にパスワード入力を求められる場合があります。
※パスワードはシステムにより自動生成されており、弊社でも確認・提供はできません。

PDFをご利用にあたっての注意

本製品は電子書籍【PDF版】です。
PDFにはメールアドレスと著作権情報が埋め込まれます。

メールアドレスはご注文時のログインアドレスが使用されます。
Amazon Payの場合はAmazonアカウントのメールアドレスが使用されます。

無断の複製・転載・譲渡・共有・販売は法律により罰せられる可能性があります。

弊社ではPC版の「Adobe Acrobat Reader」を推奨しています。
Apple Booksなどその他のアプリでは注釈機能やハイライトが利用できません。

4,400円（税込）（本体4,000円＋税10％）

1,600pt (40%) キャンペーン
ポイントの使い方はこちら

初回購入から使えるポイント500円分プレゼント

紙の書籍はこちら紙書籍とPDF版のセット商品はこちら

お気に入り

※1点の税込金額となります。複数の商品をご購入いただいた場合のお支払金額は、単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

本製品は電子書籍【PDF版】です。
ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
ご購入の前に必ずこちらをお読みください。

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチデータとストリーミングデータの分析を実
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータパイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・［日本語版オリジナルコンテンツ］pandas dataframe、spark dataframeに関する各種データフレームの使い分け
・［日本語版オリジナルコンテンツ］LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。

PDF版のご利用方法

ご購入後、SEshopにログインし、会員メニューに進みます。
ご購入電子書籍およびデータ＞ [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
PDF形式のファイルを、お好きな場所に保存してください。
端末の種類を問わず、ご利用いただけます。

第1章　Apache Spark入門：統合型アナリティクスエンジン
第2章　Apache Sparkのダウンロードとスタートアップ
第3章　Apache Sparkの構造化 API
第4章　Spark SQLとデータフレーム：組み込みのデータソースの紹介
第5章　Spark SQLとデータフレーム：外部データソースとのインタラクション
第6章　Spark SQLとデータセット
第7章　Sparkアプリケーションの最適化およびチューニング
第8章　構造化ストリーミング
第9章　Apache Sparkによる信頼性の高いデータレイクの構築
第10章　MLlibによる機械学習
第11章　Apache Sparkによる機械学習パイプラインの管理、デプロイ、スケーリング
第12章　エピローグApache Spark 3.x

各種問い合わせは以下のリンクからご連絡ください