可做奥鹏院校所有作业,毕业论文,咨询请添加QQ:3230981406 微信:aopopenfd777
[南开大学]20秋学期(1709、1803、1809、1903、1909、2003、2009 )《大数据开发技术(二)》在线作业
试卷总分:100 得分:100
第1题,Spark中DataFrame的()方法是进行排序查询
A、order by
B、group by
C、select by
D、sort by
正确答案:
第2题,var a=10;
do{
a+=1;
}while(a20)
共循环了()次
A、9
B、10
C、11
D、12
正确答案:
第3题,GraphX中()是存放着Edg对象的RDD
A、RDD[Edge]
B、EdgeRDD
C、RDD[(VertexId,VD)]
D、VertexRDD
正确答案:
第4题,Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
A、print
B、saveAsTextFiles
C、saveAsObjectFiles
D、saveAsHadoopFiles
正确答案:
答案来源:(www.),Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正确答案:
第6题,spark-submit配置项中()表示Driver程序使用的内存大小
A、--driver-memory MEM
B、--executor-memory MEM
C、--total-executor-cores NUM
D、--executor-coures NUM
正确答案:
第7题,PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。
A、join
B、union
C、substract
D、intersection
正确答案:
第8题,Scala 使用 () 关键字来继承一个类
A、extends
B、override
C、extend
D、overrides
正确答案:
第9题,GraphX中graph.edges可以得到()
A、顶点视图
B、边视图
C、顶点与边的三元组整体视图
D、有向图
正确答案:
答案来源:(www.),图结构中如果任意两个顶点之间都存在边,那么称之为()
A、完全图
B、有向完全图
C、无向图
D、简单图
正确答案:
第11题,Spark中DataFrame的()方法是进行分组查询
A、order by
B、group by
C、select by
D、sort by
正确答案:
答案来源:(www.),以下哪个函数可以求两个RDD差集 ()
A、union
B、substract
C、intersection
D、cartesian
正确答案:
第13题,()是Spark的数据挖掘算法库
A、Spark Core
B、BlinkDB
C、GraphX
D、Mllib
正确答案:
第14题,Scala列表方法中将函数应用到列表的所有元素的方法是()
A、filter
B、foreach
C、map
D、mkString
正确答案:
答案来源:(www.),以下哪个函数可以对RDD进行排序()
A、sortBy
B、filter
C、distinct
D、intersection
正确答案:
第16题,GraphX中()方法可以查询边信息
A、numVertices
B、numEdges
C、vertices
D、edges
正确答案:
第17题,Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
A、filter
B、foreach
C、map
D、mkString
正确答案:
第18题,Spark中DataFrame的()方法是进行条件查询
A、where
B、join
C、limit
D、apply
正确答案:
第19题,下列Scala代码应输出():
var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) {sum+=a+b;}println(sum);
A、36
B、35
C、11
D、12
正确答案:
答案来源:(www.),Scala列表方法中返回所有元素,除了最后一个的方法是()
A、drop
B、head
C、filter
D、init
正确答案:
第21题,spark-submit配置项中()表示启动的executor数量
A、--num-executors NUM
B、--executor-memory MEM
C、--total-executor-cores NUM
D、--executor-coures NUM
正确答案:
第22题,图结构中如果任意两个顶点之间都存在有向边,那么称之为()
A、完全图
B、有向完全图
C、无向图
D、简单图
正确答案:
第23题,在图结构中,每个元素都可以有()前驱
A、至少一个
B、零个或多个
C、一个
D、零个
正确答案:
第24题,Spark Streming中()函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象
A、map
B、flatMap
C、filter
D、union
正确答案:
答案来源:(www.),()可以解决图计算问题
A、Spark Core
B、BlinkDB
C、GraphX
D、Mllib
正确答案:
第26题,MLBase包括()
A、Mllib
B、MLI
C、SparkR
D、GraphX
正确答案:,B
第27题,MapReudce不适合()任务
A、大数据计算
B、迭代
C、交互式
D、离线分析
正确答案:
第28题,RDD是一个()的数据结构
A、可读写
B、只读的
C、容错的
D、可进行并行操作的
正确答案:
第29题,Spark可以从()分布式文件系统中读取数据
A、HDFS
B、Hbase
C、Hive
D、Tachyon
正确答案:
答案来源:(www.),以下算法中属于监督学习算法的是()
A、KNN算法
B、逻辑回归
C、随机森林
D、Kmeans
正确答案:,B,C
第31题,以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区()
A、resetpartition
B、repartiton
C、Partition
D、coalesce
正确答案:
第32题,Spark创建DataFrame对象方式有()
A、结构化数据文件
B、外部数据库
C、RDD
D、Hive中的表
正确答案:,B,C,D
第33题,MLlib中用于线性回归算法的包主要有()
A、LinearRegressionWithSGD
B、RidgeRegressionWithSGD
C、LassoWithSGD
D、LeftRegression
正确答案:,B,C
第34题,以下哪个方法可以从集合中创建RDD()
A、parallelize
B、makeRDD
C、textFile
D、loadFile
正确答案:,B
第35题,Mllib实现了一些常见的机器学习算法和应用程序,包括()
A、分类
B、聚类
C、降维
D、回归
正确答案:,B,C,D
第36题,默认情况下,Scala 使用的是可变集合
T、对
F、错
正确答案:
第37题,RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。
T、对
F、错
正确答案:
第38题,Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数
T、对
F、错
正确答案:F
第39题,RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
T、对
F、错
更多答案下载:(www.)
第40题,RDD中zip操作要求两个RDD的partition数量以及元素数量都相同
T、对
F、错
正确答案:
第41题,用户可以在Apache Mesos上运行Spark
T、对
F、错
更多答案下载:(www.)
第42题,Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。
T、对
F、错
正确答案:F
第43题,Scala中创建一个方法时经常用void表示该方法无返回值
T、对
F、错
正确答案:
第44题,图(Graph)是一种复杂的非线性结构
T、对
F、错
更多答案下载:(www.)
第45题,Scala 集合分为可变的和不可变的集合
T、对
F、错
更多答案下载:(www.)
第46题,用户可以在Hadoop YARN上运行Spark
T、对
F、错
正确答案:
第47题,Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗
T、对
F、错
正确答案:F
第48题,Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。
T、对
F、错
正确答案:
第49题,RDD是一个可读写的数据结构
T、对
F、错
正确答案:
答案来源:(www.),RDD的sortBy排序默认是升序
T、对
F、错
正确答案: