20秋南开《大数据开发技术（二）》在线作业百分-南开大学-无忧答案网

奥鹏答案 发表于 2020-10-19 09:32:56

20秋南开《大数据开发技术（二）》在线作业百分

20秋学期（1709、1803、1809、1903、1909、2003、2009）《大数据开发技术（二）》在线作业
1.[单选题] （）可以解决图计算问题
无忧答案网答案资料下载，请参考帮助中心说明
A.Spark Core
B.BlinkDB
C.GraphX
D.Mllib
答:——C——
2.[单选题] 图结构中如果无重复的边或者顶点到自身的边，那么称之为（）
A.完全图
B.有向完全图
C.无向图
D.简单图
答:——D——
3.[单选题] （）是Spark的核心，提供底层框架及核心支持
A.Spark Core
B.Spark SQL
C.Spark Streaming
D.Mllib
答:——A——
4.[单选题] 递归函数意味着函数可以调用它（）
A.其他函数
B.主函数
C.子函数
D.自身
答:————
5.[单选题] 请问RDD的（）操作是根据键对两个RDD进行内连接
A.join
B.zip
C.combineByKey
D.collect
答:————
6.[单选题] Dstream窗口操作中（）方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
答:————
7.[单选题] Spark Streming中（）函数当被调用类型分别为（K，V）和（K，W）键值对的2个DStream 时，返回类型为（K，（V，W））键值对的一个新 DStream。
A.union
B.reduce
C.join
D.cogroup
答:————
8.[单选题] Spark Streming中（）函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A.map
B.flatMap
C.filter
D.union
答:———— 福师答案请进 ap5u.com 或联系Q1647861640
9.[单选题] 请问RDD的（）操作用于将相同键的数据聚合
A.join
B.zip
C.combineByKey
D.collect
答:————
10.[单选题] RDD的（）操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
答:————
11.[单选题] Scala通过（）来定义变量
A.val
B.val
C.define
D.def
答:————
12.[单选题] 下列Scala代码应输出（）：
var a=0;
var b=0
var sum=0;
for(a<-1 until 3; b<-1 until 3) {
sum+=a+b;
}
println(sum);
A.36
B.35
C.11
D.12
答:————
13.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法（）训练回归树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
答:————
14.[单选题] 以下哪个不是Scala的数据类型（）
A.AnyRef
B.Anything
C.NULL
D.Nothing
答:————
15.[单选题] Spark GraphX中类Graph的reverse方法可以（）
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性
D.合并边相同的属性
答:————
16.[单选题] 图结构中如果任意两个顶点之间都存在边，那么称之为（）
A.完全图
B.有向完全图
C.无向图
D.简单图
答:————
17.[单选题] Graph类中如果根据边数据创建图，数据需要转换成RDD类型，应该用（）方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答:————
18.[单选题] spark-submit配置项中（）表示启动的executor数量
A.--num-executors NUM
B.--executor-memory MEM
C.--total-executor-cores NUM
D.--executor-coures NUM
答:————
19.[单选题] 以下算法中属于无监督学习算法的是（）
A.KNN算法
B.逻辑回归
C.随机森林
D.Kmeans
答:————
20.[单选题] Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是（）
A.filter
B.flatten
C.grouby
D.flatmap
答:————
21.[单选题] 以下哪个函数可以求两个RDD差集（）
A.union
B.substract
C.intersection
D.cartesian
答:————
22.[单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是（）
A.filter
B.foreach
C.map
D.mkString
答:————
23.[单选题] Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（）方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答:————
24.[单选题] 以下哪个函数可以求两个RDD交集（）
A.union
B.substract
C.intersection
D.cartesian
答:————
25.[单选题] （）是Spark的数据挖掘算法库
A.Spark Core
B.BlinkDB
C.GraphX
D.Mllib
答:————
26.[多选题] Scala中使用（）方法来查看两个集合的交集元素
A.Set.concat
B.Set.&
C.Set.&&
D.Set.intersect
答:————
27.[多选题] 以下哪个方法可以从集合中创建RDD（）
A.parallelize
B.makeRDD
C.textFile
D.loadFile
答:————
28.[多选题] 以下是机器学习的常用算法的是（）
A.回归算法
B.聚类算法
C.降维算法
D.分类算法
答:————
29.[多选题] Mllib实现了一些常见的机器学习算法和应用程序，包括（）
A.分类
B.聚类
C.降维
D.回归
答:————
30.[多选题] Spark是一个（）计算框架
A.快速
B.分布式
C.可扩展
D.容错
答:————
31.[多选题] MapReudce不适合（）任务
A.大数据计算
B.迭代
C.交互式
D.离线分析
答:————
32.[多选题] Spark创建DataFrame对象方式有（）
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
答:————
33.[多选题] Spark的RDD持久化操作有()方式
A.cache
B.presist
C.storage
D.long
答:————
34.[多选题] 以下哪个是Scala的数据类型（）
A.Any
B.NULL
C.Nothing
D.AnyRef
答:————
35.[多选题] Spark中DataFrame的（）方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
答:————
36.[判断题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除
A.对
B.错
答:————
37.[判断题] RDD的map操作不会改变RDD的分区数目
A.对
B.错
答:————
38.[判断题] RDD的sortBy函数包含参数numPartitions，该参数决定排序后的RDD的分区个数，默认排序后的分区个数和排序之前的个数相等，即为this.partitions.size。
A.对
B.错
答:————
39.[判断题] Scala是一种纯面向对象的语言，每个值都是对象。
A.对
B.错
答:————
40.[判断题] MLlib中Normalizer是一个转换器，它可以将多行向量输入转化为统一的形式。
A.对
B.错
答:————
41.[判断题] PairRDD中mapValues是针对键值对（Key，Value）类型的数据中的key和Value进行Map操作
A.对
B.错
答:————
42.[判断题] RDD的filter过滤会将返回值为true的过滤掉
A.对
B.错
答:————
43.[判断题] Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。
A.对
B.错
答:————
44.[判断题] Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素
A.对
B.错
答:————
45.[判断题] Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值
A.对
B.错
答:————
46.[判断题] Scala在子类中重写超类的抽象方法时，需要使用override关键字
A.对
B.错
答:————
47.[判断题] RDD是一个可读写的数据结构
A.对
B.错
答:————
48.[判断题] Scala中创建一个方法时经常用void表示该方法无返回值
A.对
B.错
答:————
49.[判断题] RDD中的collect 函数是一个行动操作，把RDD 所有元素转换成数组并返回到Driver 端，适用于大数据处理后的返回。
A.对
B.错
答:————
50.[判断题] Spark Streming中Dstream是一种抽象的离散流
A.对
B.错
答:————

无忧答案网附件是答案，请核对题目下载

页: [1]

无忧答案网's Archiver

20秋南开《大数据开发技术（二）》在线作业百分