以下文字与答案无关
提示:有些试题内容 显示不完整,文字错误 或者 答案显示错误等问题,这是由于我们在扫描录入过程中 机器识别错误导致,人工逐条矫正总有遗漏,所以恳请 广大网友理解。
SQL
B:Shark
C:Spark RDD
D:MapReduce
RDD
B:DataFrame
C:Spark SQL
D:Object
Catalyst
B:Execution
C:Parser
D:Analyzer
show()
B:map() C:toDF()
D:printSchema()
Spark on Mesos模式
B:Spark on YARN模式
C:Spark on Kubernetes模式
D:Local模式
Spark Streaming是Spark的核心子框架之一。
B:Spark Streaming具有可伸缩、高吞吐量、容错能力强等特点。
C:Spark Streaming处理的数据源可以来自Kafka。
D:Spark Streaming不能和Spark SQL、Mllib、GraphX无缝集成。
spark sql Release 版本
B:引入 Spark R
C:DataFrame
D:支持动态资源分配
RDD在Spark中运行时,将作业的DAG划分成不同的Stage的阶段是()。 -----------
选项: A:RDD Objects
B:DAGScheduler
C:TaskScheduler
D:Worker
RDD Objects
B:DAGScheduler
C:TaskScheduler
D:Worker
dataframe数据处理不在内存中
B:dataframe有表头
C:dataframe的创建接口不同
D:dataframe可以使用sql语言
Spark的运算效率是Hadoop的10倍
B:Spark的运算效率是Hadoop的100倍
C:Hadoop的运算效率是Spark的100倍
D:Hadoop的运算效率是Spark的10倍
show()
B:map()
C:toDF()
D:printSchema()
keeping
having
C:cheating
D:doing
INSERT,UPDATE
B:UPDATE,INSERT
C:DELETE,UPDATE
D:INSERT,SELECT
Spark采用textFile()方法来从文件系统中加载数据创建RDD
B:textFile()方法把文件的URI作为参数,这个URI可以是: 本地...