spark 1.4版本的最大变化是（）。 选项： A: spark sql Release 版本 B: 引入 Spark R C: &nbsp;DataFrame D: 支持动态资源分配

SparkSession

C:SQLContext D:

SparkContext

5.在Spark2.0版本之前，Spark SQL中创建DataFrame和执行SQL的入口是（）。选项： A:

HiveContext

SparkSession

SQLContext

SparkContext

6.spark1.4版本的最大变化是( ) 选项： A: spark B: 引入Spark C: DataFrame D: 支持动态资源分配

7.Spark SQL的前身是()。
选项： A:

SQL

Shark

Spark RDD

MapReduce

8.下面关于Spark MLlib库的描述正确的是：

A、MLlib库从1.2版本以后分为两个包：spark.mllib和spark.ml

B、spark.mllib包含基于DataFrame的原始算法API

C、spark.mllib包含基于RDD的原始算法API

D、spark.ml则提供了基于RDD的、高层次的API

9.SparkContext是选项： A:

进入Spark的入口点

spark的上下文

spark的环境配置函数

spark的任务设置函数

10.在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。选项： A:

show()

B:map() C:

toDF()

printSchema()

11.spark-sql的前身是选项： A:

shark

mapreduce

hbase

hive

12.在Spark中，调用RDD的（）方法，可以将RDD转换为DataFrame对象。选项： A:

show()

map()

toDF()

printSchema()

13.下面关于Spark Streaming的描述错误的是：

A、Spark Streaming的基本原理是将实时输入数据流以时间片为单位进行拆分，然后采用Spark引擎以类似批处理的方式处理每个时间片数据

B、Spark Streaming最主要的抽象是DStream（Discretized Stream，离散化数据流），表示连续不断的数据流

C、Spark Streaming可整合多种输入数据源，如Kafka、Flume、HDFS，甚至是普通的TCP套接字

D、Spark Streaming的数据抽象是DataFrame

14.

RDD在Spark中运行时，将作业的DAG划分成不同的Stage的阶段是（）。 -----------

RDD Objects

DAGScheduler

TaskScheduler

Worker

15.spark中的sparkcontext是选项： A:

主节点

从节点

执行器