以下文字与答案无关
提示:有些试题内容 显示不完整,文字错误 或者 答案显示错误等问题,这是由于我们在扫描录入过程中 机器识别错误导致,人工逐条矫正总有遗漏,所以恳请 广大网友理解。
A、Spark Streaming
B、MLlib
C、GraphX
D、Flink
Spark Streaming是Spark的核心子框架之一。
B:Spark Streaming具有可伸缩、高吞吐量、容错能力强等特点。
C:Spark Streaming处理的数据源可以来自Kafka。
D:Spark Streaming不能和Spark SQL、Mllib、GraphX无缝集成。
Spark SQL
B:Spark Streaming
C:Spark MLilb
D:Spark Graphx
易用性
B:容错性
C:易整合性
D:低吞吐量
Spark Streaming的基本原理是将实时输入数据流以时间片为单位进行拆分,然后采用Spark引擎以类似批处理的方式处理每个时间片数据
B:Spark Streaming最主要的抽象是DStream(Discretized Stream,离散化数据流),表示连续不断的数据流
Spark Streaming可整合多种输入数据源,如Kafka、Flume、HDFS,甚至是普通的TCP套接字
Spark Streaming的数据抽象是DataFrame
流计算
B:Hadoop
C:数据仓库
D:语境搜索
在RDD编程中需要生成一个SparkContext对象
在Spark SQL编程中需要生成一个SparkSession对象
C:运行一个Spark Streaming程序,就需要首先生成一个StreamingContext对象
D:在Spark SQL编程中需要生成一个StreamingContext对象
IBM
B:苹果
C:微软
D:网景
分区
B:数据块
C:Task
D:Job