翔泳社の公式通販SEshopは全国送料無料!
ヘルプ 法人のお客様へ 新規会員登録 ログイン
SEshop

Apache Spark徹底入門【PDF版】

Jules S. Damji(原著) , Brooke Wenig(原著) , Tathagata Das(原著) , Denny Lee(原著) , 長谷川 亮(翻訳) , 弥生 隆明(翻訳) , 北村 匡彦(翻訳) , 竹下 俊一郎(翻訳) , 小谷 尚太郎(翻訳) , 北岡 早紀(翻訳) , 市村 幸一郎(翻訳) , 永里 洋(翻訳) , 野上 将嗣(翻訳)

商品番号
186780
販売状態
発売中
納品形態
会員メニューよりダウンロード
発売日
2024年04月12日
ISBN
9784798186788
データサイズ
約31.0MB
制限事項
印刷可・テキストのコピー可
キーワード
電子書籍【PDF版】  データ分析  徹底入門シリーズ

4,400円(税込)(本体4,000円+税10%)
送料無料

400pt (10%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

紙の書籍はこちら 紙書籍とPDF版のセット商品はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

  • ポスト
  • 本製品は電子書籍【PDF版】です。
  • ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
    PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
    Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
  • 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
  • ご購入の前に必ずこちらをお読みください。

Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説

本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。

本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。

・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。

PDF版のご利用方法

  1. ご購入後、SEshopにログインし、会員メニューに進みます。
  2. ご購入電子書籍およびデータ > [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
  3. 購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
  4. PDF形式のファイルを、お好きな場所に保存してください。
  5. 端末の種類を問わず、ご利用いただけます。
画像01

第1章 Apache Spark入門:統合型アナリティクスエンジン
第2章 Apache Sparkのダウンロードとスタートアップ
第3章 Apache Sparkの構造化 API
第4章 Spark SQLとデータフレーム:組み込みのデータソースの紹介
第5章 Spark SQLとデータフレーム:外部データソースとのインタラクション
第6章 Spark SQLとデータセット
第7章 Sparkアプリケーションの最適化およびチューニング
第8章 構造化ストリーミング
第9章 Apache Sparkによる信頼性の高いデータレイクの構築
第10章 MLlibによる機械学習
第11章 Apache Sparkによる機械学習パイプラインの管理、デプロイ、スケーリング
第12章 エピローグApache Spark 3.x

各種問い合わせは以下のリンクからご連絡ください

関連商品

おすすめ特集

【2024年】SEshop人気書籍 ベスト20

2024年にSEshopで人気だった本を20冊ご紹介!IT技術、生成AI活用、マネジメント本など

プログラミング入門書大特集

翔泳社のプログラミング書籍の中から、入門・初級者向けの書籍をピックアップ!

エンジニア必携特集

【エンジニア必携特集】開発現場で使える!ITエンジニアの業務に役立つ書籍を一挙ご紹介

ライティングおすすめ本

ライティングのスキルアップにおすすめの本。Webライティングやコピーライティングなど

手帳術

毎日をもっと楽しく、充実させる手帳・ノートの活用術書をご紹介

電気工事技術者

第二種電気工事士、電験3種など、電気工事技術者関連の資格参考書はこちら

特集をもっと見る