SEshop

Apache Spark徹底入門【PDF版】

Jules S. Damji(原著) , Brooke Wenig(原著) , Tathagata Das(原著) , Denny Lee(原著) , 長谷川 亮(翻訳) , 弥生 隆明(翻訳) , 北村 匡彦(翻訳) , 竹下 俊一郎(翻訳) , 小谷 尚太郎(翻訳) , 北岡 早紀(翻訳) , 市村 幸一郎(翻訳) , 永里 洋(翻訳) , 野上 将嗣(翻訳)

商品番号
186780
販売状態
発売中
納品形態
会員メニューよりダウンロード
発売日
2024年04月12日
ISBN
9784798186788
データサイズ
約31.0MB
キーワード
電子書籍【PDF版】  データ分析  徹底入門シリーズ
制限事項
印刷可・テキストのコピー可
PDFの利用制限は商品ごとに異なります。
上記の「制限事項」欄をご確認ください。
  • 印刷可・テキストのコピー可
    Adobe Acrobat Reader などのPDF閲覧アプリで、問題なくご利用いただけるケースが多く確認されています。
    ※すべてのアプリでの動作を保証するものではありません。
  • 印刷不可・テキストのコピー不可
    「編集・印刷・コピー禁止」などの制限が設定されています。 一部のアプリでは、読み込み時にパスワード入力を求められる場合があります。
    ※パスワードはシステムにより自動生成されており、弊社でも確認・提供はできません。
本製品は電子書籍【PDF版】です。
PDFにはメールアドレスと著作権情報が埋め込まれます。
  • メールアドレスはご注文時のログインアドレスが使用されます。
  • Amazon Payの場合はAmazonアカウントのメールアドレスが使用されます。
無断の複製・転載・譲渡・共有・販売は法律により罰せられる可能性があります。
弊社ではPC版の「Adobe Acrobat Reader」を推奨しています。
Apple Booksなどその他のアプリでは注釈機能やハイライトが利用できません。

4,400円(税込)(本体4,000円+税10%)

1,600pt (40%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

紙の書籍はこちら 紙書籍とPDF版のセット商品はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

  • ポスト
  • 本製品は電子書籍【PDF版】です。
  • ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
    PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
    Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
  • 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
  • ご購入の前に必ずこちらをお読みください。

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。

PDF版のご利用方法

  1. ご購入後、SEshopにログインし、会員メニューに進みます。
  2. ご購入電子書籍およびデータ > [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
  3. 購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
  4. PDF形式のファイルを、お好きな場所に保存してください。
  5. 端末の種類を問わず、ご利用いただけます。
画像01

第1章 Apache Spark入門:統合型アナリティクスエンジン
第2章 Apache Sparkのダウンロードとスタートアップ
第3章 Apache Sparkの構造化 API
第4章 Spark SQLとデータフレーム:組み込みのデータソースの紹介
第5章 Spark SQLとデータフレーム:外部データソースとのインタラクション
第6章 Spark SQLとデータセット
第7章 Sparkアプリケーションの最適化およびチューニング
第8章 構造化ストリーミング
第9章 Apache Sparkによる信頼性の高いデータレイクの構築
第10章 MLlibによる機械学習
第11章 Apache Sparkによる機械学習パイプラインの管理、デプロイ、スケーリング
第12章 エピローグApache Spark 3.x

各種問い合わせは以下のリンクからご連絡ください

関連商品

おすすめ特集・キャンペーン

20代社会人におすすめの本

[特集]20代の社会人が読むべき本!若手のうちに上質なビジネスマインド…

AWS

[特集]「AWSって何?」という初心者に向けた超入門書から、実践・検定…

ベンダー資格 試験対策本特集

[特集]ベンダー資格に関する書籍を試験ごとに紹介!ベンダー資格試験対策…

Web制作関連本特集

[特集]Web制作・フロントエンド開発のためのおすすめ本をご紹介!

社会人に人気の資格

[特集]社会人に人気の資格を効率よく勉強できる、豊富なジャンルの対策書…

特集をもっと見る