Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク

翔泳社(出版社) , 株式会社NTTデータ(著) , 猿田浩輔(著) , 土橋昌(著) , 吉田耕陽(著) , 佐々木徹(著) , 都築正宜(著) , 下垣徹(監修)

商品番号
142660
販売状態
発売中
納品形態
宅配便にてお届け
発売日
2015年10月28日
ISBN
9784798142661
判型
B5変
ページ数
320
キーワード
プログラミング  システム構築  ビッグデータ

販売価格:¥3,456(税込)

ポイント:320pt (10%)
詳細はこちら

送料無料 在庫あり

電子書籍を見る
ほしい物リストに追加

Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。

Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。

本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。

話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。

第1章:Apache Sparkとは
第2章:Sparkの処理モデル
第3章:Sparkの導入
第4章:Sparkアプリケーションの開発と実行
第5章:基本的なAPIを用いたプログラミング
第6章:構造化データセットを処理する - Spark SQL -
第7章:ストリームデータを処理する - Spark Streaming -
第8章:機械学習を行う - MLlib -
Appendix
A. GraphXによるグラフ処理
B. SparkRを使ってみる
C. 機械学習とストリーム処理の連携
D. Web UIの活用
各種問い合わせは以下のリンクからご連絡ください

関連リンク

関連商品

入門Haskellプログラミング

販売価格:4,104円(税込)

2019.07.31発売

絵で見てわかる量子コンピュータの仕組み

販売価格:2,786円(税込)

2019.07.10発売

絵で見てわかる量子コンピュータの仕組み【PDF版】

販売価格:2,786円(税込)

2019.07.10発売

おすすめ特集

今月のクーポン

翔泳社の通販SEshopなら全品送料無料、ポイント還元、さらに毎月更新の割引クーポンでお得!

アジャイル・スクラム関連本特集

アジャイル・スクラム入門書からプロフェッショナル向け開発書、チームマネジメント論まで。

Python特集

【今からはじめるPython特集】おすすめ本を入門~上級までレベル別にご紹介!

情報処理教科書シリーズ

情報処理技術者試験におすすめの参考書「EXAMPRESS 情報処理教科書シリーズ」で最短合格!

起業に役立つ技術書特集

【起業に役立つ技術書特集】Webサービスを始め、副業やスモールビジネスにオススメの技術書をご案内。

「みんなの日記」シリーズ特集

いつもの家事、暮らし。少し変えるだけで、もっと楽しくなる!「みんなの日記」シリーズ特集。

特集をもっと見る