Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

翔泳社(出版社) , 株式会社NTTデータ(著) , 猿田浩輔(著) , 土橋昌(著) , 吉田耕陽(著) , 佐々木徹(著) , 都築正宜(著) , 下垣徹(監修)

商品番号
142660
販売状態
発売中
納品形態
宅配便にてお届け
発売日
2015年10月28日
出荷開始日
2015年10月29日
ISBN
9784798142661
判型
B5変
ページ数
320
キーワード
プログラミング  システム構築  ビッグデータ

販売価格:¥3,520(税込)

ポイント:320pt (10%)
詳細はこちら

送料無料 在庫あり

電子書籍を見る
ほしい物リストに追加

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。

Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。

本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。

話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。

第1章:Apache Sparkとは
第2章:Sparkの処理モデル
第3章:Sparkの導入
第4章:Sparkアプリケーションの開発と実行
第5章:基本的なAPIを用いたプログラミング
第6章:構造化データセットを処理する - Spark SQL -
第7章:ストリームデータを処理する - Spark Streaming -
第8章:機械学習を行う - MLlib -
Appendix
A. GraphXによるグラフ処理
B. SparkRを使ってみる
C. 機械学習とストリーム処理の連携
D. Web UIの活用
各種問い合わせは以下のリンクからご連絡ください

関連リンク

関連商品

独習JSP&サーブレット 第3版

販売価格:3,960円(税込)

2021.12.21発売

入門WebAssembly

販売価格:3,850円(税込)

2021.12.15発売

図解まるわかり アルゴリズムのしくみ

販売価格:1,848円(税込)

2021.12.13発売

おすすめ特集

ベンダー資格 試験対策本特集

ベンダー資格に関する書籍を試験ごとに紹介!ベンダー資格試験対策本特集

アジャイル・スクラム関連本特集

アジャイル・スクラム入門書からプロフェッショナル向け開発書、チームマネジメント論まで。

SQL/データベース関連本特集

初心者向けの入門書から、達人レベルの専門書まで!SQL/データベース関連おすすめ本特集。

Excel本大特集

【Excel本大特集】業務効率化やスキルアップに!おすすめの学習書をご紹介。

デジタルマーケティング本特集

Webマーケティング、データ分析、ECなど、デジタルマーケティングに関するおすすめ書籍をご紹介。

翔泳社のセミナー・講座

開発・ビジネス・マーケティング・EC運営・営業支援など、幅広いジャンルの講座を開催。

特集をもっと見る