以下流计算框架中，哪个不是开源的： A:IBM StreamBase B:Twitter Storm C:Yahoo! S4 D:Spark Streaming

Spark Streaming具有可伸缩、高吞吐量、容错能力强等特点。

Spark Streaming处理的数据源可以来自Kafka。

Spark Streaming不能和Spark SQL、Mllib、GraphX无缝集成。

8.spark为处理结构化数据而设计的模块是选项： A:

Spark SQL

Spark Streaming

Spark MLilb

Spark Graphx

9.关于Spark Streaming的优点，不包括哪个（）。选项： A:

易用性

容错性

易整合性

低吞吐量

10.下面关于Spark Streaming的描述错误的是：（）选项： A:

Spark Streaming的基本原理是将实时输入数据流以时间片为单位进行拆分，然后采用Spark引擎以类似批处理的方式处理每个时间片数据

Spark Streaming最主要的抽象是DStream（Discretized Stream，离散化数据流），表示连续不断的数据流

Spark Streaming可整合多种输入数据源，如Kafka、Flume、HDFS，甚至是普通的TCP套接字

13.IBM大数据平台和应用程序框架，（）以经济高效的方式分析PB级的结构化和非结构化信息选项： A:

Spark Streaming的数据抽象是DataFrame

11.以下哪些是开源的流计算框架选项：A、Facebook Puma B、Yahoo! S4 C、IBM InfoSphere Streams D、Twitter Storm

12.以下哪些是开源的流计算框架: 选项： A:Twitter Storm B:Facebook Puma C:Yahoo! S4 D:IBM InfoSphere Streams

流计算

Hadoop

数据仓库

语境搜索

在RDD编程中需要生成一个SparkContext对象

在Spark SQL编程中需要生成一个SparkSession对象

运行一个Spark Streaming程序，就需要首先生成一个StreamingContext对象

在Spark SQL编程中需要生成一个StreamingContext对象

15.“Word 2000”属于哪个公司的产品（）。选项： A:

IBM

苹果

微软

网景

16.Spark中RDD的计算函数的基本单位是（）。选项： A:

分区

数据块

Task