spark 1.4版本的最大变化是（）。 选项： A: spark sql Release 版本 B: 引入 Spark R C: DataFrame D: 支持动态资源分配

引入 Spark R

DataFrame

支持动态资源分配

2.在Spark2.0版本之前，Spark SQL中创建DataFrame和执行SQL的入口是（）。选项： A:

HiveContext

SparkSession

SQLContext

SparkContext

3.在Spark2.0版本之前，Spark SQL中创建DataFrame和执行SQL的入口是（）。选项： A:

HiveContext

SparkSession

C:SQLContext D:

SparkContext

4.Spark的集群部署模式不包括选项： A:

standalone

Spark on Mesos

Spark on YARN

Local

5.SparkContext是选项： A:

进入Spark的入口点

spark的上下文

spark的环境配置函数

spark的任务设置函数

6.在spark中，dataframe与rdd的区别有选项： A:

dataframe数据处理不在内存中

dataframe有表头

dataframe的创建接口不同

dataframe可以使用sql语言

7.以下哪个不是Spark的组件?

A、Spark Streaming

B、MLlib

C、GraphX

D、Flink

8.Spark SQL快速的计算效率得益于（）。选项： A:

Catalyst

Execution

Parser

Analyzer

9.在Spark中，调用RDD的（）方法，可以将RDD转换为DataFrame对象。选项： A:

show()

map()

toDF()

printSchema()

10.以下有关spark shell的叙述哪一项是错误的？选项： A:

要想启动使用Scala语言的Spark shell,用cd命令进入 bin目录(也可以把bin目录设置到path环境变量中)，然后输入spark-shell即可

可以使用spark shel将一个文本文件读入为DataFrame

退出Spark shell，可以按下Ctri-Q

在Spark shell中也可以使用import语句

11.下面关于Spark Streaming的描述错误的是：（）选项： A:

Spark Streaming的基本原理是将实时输入数据流以时间片为单位进行拆分，然后采用Spark引擎以类似批处理的方式处理每个时间片数据

Spark Streaming最主要的抽象是DStream（Discretized Stream，离散化数据流），表示连续不断的数据流

Spark Streaming可整合多种输入数据源，如Kafka、Flume、HDFS，甚至是普通的TCP套接字

Spark Streaming的数据抽象是DataFrame

12.下面描述错误的是：

A、在RDD编程中需要生成一个SparkContext对象

B、在Spark SQL编程中需要生成一个SparkSession对象

C、运行一个Spark Streaming程序，就需要首先生成一个StreamingContext对象

D、在Spark SQL编程中需要生成一个StreamingContext对象

13.在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。选项： A:

show()

B:map() C:

toDF()

printSchema()

14.下面关于Spark Streaming的描述错误的是：

A、Spark Streaming的基本原理是将实时输入数据流以时间片为单位进行拆分，然后采用Spark引擎以类似批处理的方式处理每个时间片数据

B、Spark Streaming最主要的抽象是DStream（Discretized Stream，离散化数据流），表示连续不断的数据流

C、Spark Streaming可整合多种输入数据源，如Kafka、Flume、HDFS，甚至是普通的TCP套接字

D、Spark Streaming的数据抽象是DataFrame

15.spark中的sparkcontext是选项： A:

主节点

从节点

执行器

上下文

16.以下哪个不是大数据时代新兴的技术：选项： A:

HBase

Hadoop

MySQL