Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

株式会社NTTデータ(著) , 猿田 浩輔(著) , 土橋 昌(著) , 吉田 耕陽(著) , 佐々木 徹(著) , 都築 正宜(著) , 下垣 徹(監修)

商品番号
142660
販売状態
発売中
納品形態
宅配便にてお届け
発売日
2015年10月28日
出荷開始日
2015年10月29日
ISBN
9784798142661
判型
B5変
ページ数
320
キーワード
プログラミング  システム構築  ビッグデータ

販売価格:¥3,520(税込)

ポイント:320pt (10%)
詳細はこちら

送料無料 在庫あり

電子書籍を見る
ほしい物リストに追加

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。

Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。

本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。

話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。

第1章:Apache Sparkとは
第2章:Sparkの処理モデル
第3章:Sparkの導入
第4章:Sparkアプリケーションの開発と実行
第5章:基本的なAPIを用いたプログラミング
第6章:構造化データセットを処理する - Spark SQL -
第7章:ストリームデータを処理する - Spark Streaming -
第8章:機械学習を行う - MLlib -
Appendix
A. GraphXによるグラフ処理
B. SparkRを使ってみる
C. 機械学習とストリーム処理の連携
D. Web UIの活用
各種問い合わせは以下のリンクからご連絡ください

関連リンク

関連商品

動かして学ぶ!Python Django開発入門 第2版

販売価格:3,740円(税込)

2022.03.14発売

手づくり工作をうごかそう!micro:bitプログラミング 第2版

販売価格:2,090円(税込)

2022.02.15発売

おすすめ特集

情報処理教科書シリーズ

情報処理技術者試験におすすめの参考書「EXAMPRESS 情報処理教科書シリーズ」で最短合格!

ベンダー資格 試験対策本特集

ベンダー資格に関する書籍を試験ごとに紹介!ベンダー資格試験対策本特集

ゲームプログラミング・ゲーム制作関連本

趣味で始めてみたい方や、ゲームプログラマー・ゲームデザイナーにもおすすめ!ゲーム制作おすすめ本

Excel本大特集

【Excel本大特集】業務効率化やスキルアップに!おすすめの学習書をご紹介。

マネジメント・リーダーシップ特集

人材育成やチームビルディング、プロダクトマネジメントや業務改善など、組織を目標達成に導く書籍

翔泳社のセミナー・講座

開発・ビジネス・マーケティング・EC運営・営業支援など、幅広いジャンルの講座を開催。

特集をもっと見る