Spark快速數(shù)據(jù)處理.pdf
http://www.www.srpcoatings.com
2020年11月16日
![]() |
| 第1頁 |
![]() |
| 第8頁 |
![]() |
| 第11頁 |
![]() |
| 第30頁 |
![]() |
| 第32頁 |
![]() |
| 第82頁 |
參見附件(18744KB,135頁)。
Spark快速數(shù)據(jù)處理版
大數(shù)據(jù)是近幾年廣受關(guān)注的一個(gè)概念。今天,互聯(lián)網(wǎng)不斷發(fā)展,逐漸深入我們生活的各個(gè)層面,隨之而來的是數(shù)據(jù)量的指數(shù)級(jí)增長(zhǎng)。很久以前,人類就學(xué)會(huì)了通過分析數(shù)據(jù)獲取有價(jià)值的結(jié)論。有時(shí),影響結(jié)論的因素過多,采樣的數(shù)據(jù)無法有效保留所有因素的影響

相關(guān)內(nèi)容部分預(yù)覽







圖書簡(jiǎn)介
Spark是一個(gè)開源的通用并行分布式計(jì)算框架,由加州大學(xué)伯克利分校的AMP實(shí)驗(yàn)室開發(fā),支持內(nèi)存計(jì)算、多迭代批量處理、即席查詢、流處理和圖計(jì)算等多種范式。Spark內(nèi)存計(jì)算框架適合各種迭代算法和交互式數(shù)據(jù)分析,能夠提升大數(shù)據(jù)處理的實(shí)時(shí)性和準(zhǔn)確性,現(xiàn)已逐漸獲得很多企業(yè)的支持,如阿里巴巴、百度、網(wǎng)易、英特爾等公司。
本書系統(tǒng)講解Spark的使用方法,包括如何在多種機(jī)器上安裝Spark,如何配置一個(gè)Spark集群,如何在交互模式下運(yùn)行第一個(gè)Spark作業(yè),如何在Spark集群上構(gòu)建一個(gè)生產(chǎn)級(jí)的脫機(jī)/獨(dú)立作業(yè),如何與Spark集群建立連接和使用SparkContext,如何創(chuàng)建和保存RDD(彈性分布式數(shù)據(jù)集),如何用Spark分布式處理數(shù)據(jù),如何設(shè)置Shark,將Hive查詢集成到你的Spark作業(yè)中來,如何測(cè)試Spark作業(yè),以及如何提升Spark任務(wù)的性能。
圖書目錄
譯者序
作者簡(jiǎn)介
前言
第1章 安裝Spark以及構(gòu)建Spark集群
1.1 單機(jī)運(yùn)行Spark
1.2 在EC2上運(yùn)行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通過SSH部署集群
1.8 鏈接和參考
1.9 小結(jié)
第2章 Sparkshell的使用
2.1 加載一個(gè)簡(jiǎn)單的text文件
2.2 用Sparkshell運(yùn)行邏輯回歸
2.3 交互式地從S3加載數(shù)據(jù)
2.4 小結(jié)
第3章 構(gòu)建并運(yùn)行Spark應(yīng)用
3.1 用sbt構(gòu)建Spark作業(yè)
3.2 用Maven構(gòu)建Spark作業(yè)
3.3 用其他工具構(gòu)建Spark作業(yè)
3.4 小結(jié)
第4章 創(chuàng)建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 鏈接和參考
4.6 小結(jié)
第5章 加載與保存數(shù)據(jù)
5.1 RDD
5.2 加載數(shù)據(jù)到RDD中
5.3 保存數(shù)據(jù)
5.4 連接和參考
5.5 小結(jié)
第6章 操作RDD
6.1 用Scala和Java操作RDD
6.2 用Python操作RDD
6.3 鏈接和參考
6.4 小結(jié)
第7章 Shark-Hive和Spark的綜合運(yùn)用
7.1 為什么用HiveShark
7.2 安裝Shark
7.3 運(yùn)行Shark
7.4 加載數(shù)據(jù)
7.5 在Spark程序中運(yùn)行HiveQL查詢
7.6 鏈接和參考
7.7 小結(jié)
第8章 測(cè)試
8.1 用Java和Scala測(cè)試
8.2 用Python測(cè)試
8.3 鏈接和參考
8.4 小結(jié)
第9章 技巧和竅門
9.1 日志位置
9.2 并發(fā)限制
9.3 內(nèi)存使用與垃圾回收
9.4 序列化
9.5 IDE集成環(huán)境
9.6 Spark與其他語言
9.7 安全提示
9.8 郵件列表
9.9 鏈接和參考
9.10 小結(jié)
Spark快速數(shù)據(jù)處理版截圖




提供各種IT類書籍pdf下載,如有需要,請(qǐng)QQ:2404062482
注:鏈接至淘寶,不喜者勿入! 整理那么多資料也不容易,請(qǐng)多多見諒!非誠(chéng)勿擾! ......
注:鏈接至淘寶,不喜者勿入! 整理那么多資料也不容易,請(qǐng)多多見諒!非誠(chéng)勿擾! ......
您現(xiàn)在查看是摘要介紹頁, 詳見PDF附件(18744KB,135頁)。
據(jù)處理_1.jpg)
據(jù)處理_2.jpg)
據(jù)處理_3.jpg)
據(jù)處理_4.jpg)
據(jù)處理_5.jpg)
據(jù)處理_6.jpg)