SEshop

Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク 【PDF版】

株式会社NTTデータ(著) , 猿田 浩輔(著) , 土橋 昌(著) , 吉田 耕陽(著) , 佐々木 徹(著) , 都築 正宜(著) , 下垣 徹(監修)

商品番号
143940
販売状態
発売中
納品形態
会員メニューよりダウンロード
発売日
2016年08月30日
ISBN
9784798143941
データサイズ
約18.1MB
キーワード
プログラミング  システム構築  ビッグデータ  電子書籍【PDF版】
制限事項
印刷可・テキストのコピー可
PDFの利用制限は商品ごとに異なります。
上記の「制限事項」欄をご確認ください。
  • 印刷可・テキストのコピー可
    Adobe Acrobat Reader などのPDF閲覧アプリで、問題なくご利用いただけるケースが多く確認されています。
    ※すべてのアプリでの動作を保証するものではありません。
  • 印刷不可・テキストのコピー不可
    「編集・印刷・コピー禁止」などの制限が設定されています。 一部のアプリでは、読み込み時にパスワード入力を求められる場合があります。
    ※パスワードはシステムにより自動生成されており、弊社でも確認・提供はできません。
本製品は電子書籍【PDF版】です。
PDFにはメールアドレスと著作権情報が埋め込まれます。
  • メールアドレスはご注文時のログインアドレスが使用されます。
  • Amazon Payの場合はAmazonアカウントのメールアドレスが使用されます。
無断の複製・転載・譲渡・共有・販売は法律により罰せられる可能性があります。
弊社ではPC版の「Adobe Acrobat Reader」を推奨しています。
Apple Booksなどその他のアプリでは注釈機能やハイライトが利用できません。

3,520円(税込)(本体3,200円+税10%)

320pt (10%)
ポイントの使い方はこちら

在庫あり

初回購入から使えるポイント500円分プレゼント

紙の書籍はこちら

※1点の税込金額となります。 複数の商品をご購入いただいた場合のお支払金額は、 単品の税込金額の合計額とは異なる場合がございますので、予めご了承ください。

  • ポスト
  • 本製品は電子書籍【PDF版】です。
  • ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。
    PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。
    Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。
  • 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。
  • ご購入の前に必ずPDF利用案内をお読みください。

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。

Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。

本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。

話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。

PDF版のご利用方法

  1. ご購入後、SEshopにログインし、会員メニューに進みます。
  2. ご購入電子書籍およびデータ > [ご購入電子書籍およびダウンロードデータ一覧]をクリックします。
  3. 購入済みの電子書籍のタイトルが表示されますので、リンクをクリックしてダウンロードしてください。
  4. PDF形式のファイルを、お好きな場所に保存してください。
  5. 端末の種類を問わず、ご利用いただけます。

第1章:Apache Sparkとは
第2章:Sparkの処理モデル
第3章:Sparkの導入
第4章:Sparkアプリケーションの開発と実行
第5章:基本的なAPIを用いたプログラミング
第6章:構造化データセットを処理する - Spark SQL -
第7章:ストリームデータを処理する - Spark Streaming -
第8章:機械学習を行う - MLlib -
Appendix
A. GraphXによるグラフ処理
B. SparkRを使ってみる
C. 機械学習とストリーム処理の連携
D. Web UIの活用

各種問い合わせは以下のリンクからご連絡ください

感想・レビュー

toiwata さん

2015-12-26

読み始めてからScalaの知識が要るのではと気がつく始末。非常に大きな生態系を形成しており、端のほうを少しばかりかじり取るわけにはいかないことを実感。Googleの論文で公表された実装に対し平気で別の実装を作って公開できる潤沢な資源に圧倒される。

ショウヤ さん

2016-12-11

Sparkを触る上での最初の1冊に良い感じ。Scalaの文法が前提知識として必要なので、あわせて他の書籍を読むとよい。

関連リンク

関連商品

独習Rust【PDF版】

4,818円(税込)

2026.06.15発売

おすすめ特集・キャンペーン

デジタルイラスト参考書

[特集]基本的な描き方から高度なテクニック、デジタルツールの使い方まで…

介護職

[特集]介護職を目指す人の試験対策書、現場スタッフのための実務書など、…

おすすめイラストの本特集

[特集]人気イラストレーター作品集&メイキングブック!

SQL/データベース関連本特集

[特集]【入門~達人レベルまで】SQL/データベース関連おすすめ本特集

「デジタル時代の基礎知識」シリーズ特集

[特集]業界のスペシャリスト達がマーケティングの新ルールを提案!

保育士

[特集]保育士を目指している方にも、すでに保育現場で働き始めている方に…

特集をもっと見る