翔泳社の公式通販SEshopは全国送料無料!
ヘルプ 法人のお客様へ 新規会員登録 ログイン
SEshop

Apache Spark徹底入門【PDF版】

Jules S. Damji(原著) , Brooke Wenig(原著) , Tathagata Das(原著) , Denny Lee(原著) , 長谷川 亮(翻訳) , 弥生 隆明(翻訳) , 北村 匡彦(翻訳) , 竹下 俊一郎(翻訳) , 小谷 尚太郎(翻訳) , 北岡 早紀(翻訳) , 市村 幸一郎(翻訳) , 永里 洋(翻訳) , 野上 将嗣(翻訳)

商品番号
186780
販売状態
発売中
納品形態
会員メニューよりダウンロード
発売日
2024年04月12日
ISBN
9784798186788
データサイズ
約31.0MB
制限事項
印刷可・テキストのコピー可
キーワード
電子書籍【PDF版】  データ分析  徹底入門シリーズ

4,400円(税込)(本体4,000円+税10%)
送料無料

400pt (10%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

紙の書籍はこちら 紙書籍とPDF版のセット商品はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

  • ポスト
  • 本製品は電子書籍【PDF版】です。
  • ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
    PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
    Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
  • 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
  • ご購入の前に必ずこちらをお読みください。

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。

PDF版のご利用方法

  1. ご購入後、SEshopにログインし、会員メニューに進みます。
  2. ご購入電子書籍およびデータ > [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
  3. 購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
  4. PDF形式のファイルを、お好きな場所に保存してください。
  5. 端末の種類を問わず、ご利用いただけます。
画像01

第1章 Apache Spark入門:統合型アナリティクスエンジン
第2章 Apache Sparkのダウンロードとスタートアップ
第3章 Apache Sparkの構造化 API
第4章 Spark SQLとデータフレーム:組み込みのデータソースの紹介
第5章 Spark SQLとデータフレーム:外部データソースとのインタラクション
第6章 Spark SQLとデータセット
第7章 Sparkアプリケーションの最適化およびチューニング
第8章 構造化ストリーミング
第9章 Apache Sparkによる信頼性の高いデータレイクの構築
第10章 MLlibによる機械学習
第11章 Apache Sparkによる機械学習パイプラインの管理、デプロイ、スケーリング
第12章 エピローグApache Spark 3.x

各種問い合わせは以下のリンクからご連絡ください

関連商品

おすすめ特集

ロングセラーコンピュータ書

ITエンジニアにぜひ読んでいただきたい、翔泳社のロングセラーコンピュータ書を厳選

ITインフラ関連本特集

ネットワーク/サーバー/セキュリティを学ぶなら読んでおきたいおすすめの書籍

生成AI特集

テキスト生成、画像生成、動画生成など、生成AI活用のスキルが身につく本をご紹介

Web制作関連本特集

HTML/CSS、JavaScript、UI/UX、デザインまで。Web制作・フロントエンド開発に役立つ本

マーケティングおすすめ本

マーケティングの勉強におすすめの本。基本から実務に役立つ戦略設計まで

介護職におすすめの本

介護職を目指す人の試験対策書、現場スタッフのための実務書など、介護職に役立つ本

特集をもっと見る