大数据技术学习之Spark技术总结_

Spark是基于内存的迭代计算框架，适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多，所需读取的数据量越大，受益越大，数据量小但是计算密集度较大的场合，受益就相对较小(大数据库架构中这是是否考虑使用Spark的重要因素)。

1、Spark的核心是什么?

RDD是Spark的基本抽象,是对分布式内存的抽象使用，实现了以操作本地集合的方式来操作分布式数据集的抽象实现。RDD也是Spark非常核心的东西，它表示已被分区，不可变的并能够被并行操作的数据集合，不同的数据集格式对应不同的RDD实现。

RDD必须是可序列化的。RDD可以cache到内存中，每次对RDD数据集的操作之后的结果，都可以存放到内存中，下一个操作可以直接从内存中输入，省去了MapReduce大量的磁盘IO操作。这对于迭代运算比较常见的机器学习算法, 交互式数据挖掘来说，效率提升比较大。

2、Spark的适用场景有哪些?

由于RDD的特性，Spark不适用那种异步细粒度更新状态的应用，例如web服务的存储或者是增量的web爬虫和索引。就是对于那种增量修改的应用模型不适合。总的来说Spark的适用面比较广泛且比较通用。

3、Spark支持的编程语言有哪几种?

Spark通过与编程语言集成的方式暴露RDD的操作，类似于DryadLINQ和FlumeJava，每个数据集都表示为RDD对象，对数据集的操作就表示成对RDD对象的操作。Spark主要支持的编程语言是Scala、java、python。

Scala

Spark使用Scala开发，默认使用Scala作为编程语言。编写Spark程序比编写Hadoop MapReduce程序要简单的多，SparK提供了Spark-Shell，可以在Spark-Shell测试程序。

Java

Spark支持Java编程，但对于使用Java就没有了Spark-Shell这样方便的工具，其它与Scala编程是一样的，因为都是JVM上的语言，Scala与Java可以互操作，Java编程接口其实就是对Scala的封装。

Python

现在Spark也提供了Python编程接口，Spark使用py4j来实现python与java的互操作，从而实现使用python编写Spark程序。Spark也同样提供了pyspark，一个Spark的python shell，可以以交互式的方式使用Python编写Spark程序。

大数据技术学习之Spark技术总结（学ps的前景）学习ps技术，

在ps技术非常强大的今天，还有必要追求极致的摄影技术吗？（ps需要学多久?）学习ps技术，

报名ps课需要注意什么呢？（ps怎么报考）ps报名学习，

随便看看

对于刚开始学习PS的你我有5个建议可以让你少走弯路（学ps 的体会和心得作文）ps学习心得，

“抢食”Photoshop：亦心科技新一轮融资背后，创投盯上图像处理软件“国产化”（学ps的app推荐）ps学习软件，

开车时欣赏不到自己的车怎么办？叫好基友也买台一样的就好啦！14.39万！全新大众宝来1.5T车型上市整了“容”，换了“心”，2023款上汽大众途岳你变了4.4T

PS入门基础篇：1分钟带你熟悉最常用的PS工具及操作（ps基础知识及操作）学习ps基础，

热门文章

stable-diffusion一键更换衣服的三种方法：保持人物姿势一键换衣服教程84岁李双江痛批《罗刹海市》，称文字垃圾是文化瘟疫，评论区沦陷（手机照片彻底删

Adobe Photoshop（ps）2023中文版下载纯净、安全、无捆绑（photoshop touch）ps学习教程，

职场干货篇一：打工人职场自我提升书籍/网站分享（想学ps有什么网站或公众号）ps学习网站，

热门标签

关注我们么么哒！

大数据技术学习之Spark技术总结（学ps的前景）学习ps技术，

在ps技术非常强大的今天，还有必要追求极致的摄影技术吗？（ps需要学多久?）学习ps技术，

报名ps课需要注意什么呢？（ps怎么报考）ps报名学习，

猜你喜欢

初学PS心得（零基础学ps多久可以学会）学习ps的心得，

ps入门学习要点总结（自学ps需要什么书籍）ps学习资料，

国土空间规划“一张图”建设 | 贵州：突出管理需求，做实规划实施功能（ps简单作图教程）学习ps做图，

Photoshop基础系列_6：颜色基础理论与颜色模式（ps初学者基础教程）ps初步学习，

应该怎样去学习PS？

新手入门，这几个步骤有助于你快速学习ps（ps教程零基础入门加实战）ps基础学习，

随便看看

对于刚开始学习PS的你 我有5个建议 可以让你少走弯路（学ps 的体会和心得作文）ps学习心得，