奥鹏答案 发表于 2020-10-19 09:32:56

20秋南开《大数据开发技术(二)》在线作业百分

20秋学期(1709、1803、1809、1903、1909、2003、2009)《大数据开发技术(二)》在线作业
1.[单选题] ()可以解决图计算问题
无忧答案网答案资料下载,请参考帮助中心说明
    A.Spark Core
    B.BlinkDB
    C.GraphX
    D.Mllib
    答:——C——
2.[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()
    A.完全图
    B.有向完全图
    C.无向图
    D.简单图
    答:——D——
3.[单选题] ()是Spark的核心,提供底层框架及核心支持
    A.Spark Core
    B.Spark SQL
    C.Spark Streaming
    D.Mllib
    答:——A——
4.[单选题] 递归函数意味着函数可以调用它()
    A.其他函数
    B.主函数
    C.子函数
    D.自身
    答:————
5.[单选题] 请问RDD的()操作是根据键对两个RDD进行内连接
    A.join
    B.zip
    C.combineByKey
    D.collect
    答:————
6.[单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
    A.window
    B.countByWindow
    C.reduceByWindow
    D.reduceByKeyAndWindow
    答:————
7.[单选题] Spark Streming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream 时,返回类型为(K,(V,W))键值对的一个新 DStream。
    A.union
    B.reduce
    C.join
    D.cogroup
    答:————
8.[单选题] Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream
    A.map
    B.flatMap
    C.filter
    D.union
    答:————    福师答案请进 ap5u.com 或联系Q1647861640
9.[单选题] 请问RDD的()操作用于将相同键的数据聚合
    A.join
    B.zip
    C.combineByKey
    D.collect
    答:————
10.[单选题] RDD的()操作通常用来划分单词
    A.filter
    B.union
    C.flatmap
    D.mapPartitions
    答:————
11.[单选题] Scala通过()来定义变量
    A.val
    B.val
    C.define
    D.def
    答:————
12.[单选题] 下列Scala代码应输出():
var a=0;
var b=0
var sum=0;
for(a<-1 until 3; b<-1 until 3) {
sum+=a+b;
}
println(sum);
    A.36
    B.35
    C.11
    D.12
    答:————
13.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
    A.trainClassifier
    B.trainRegressor
    C.LogisticRegressionModel
    D.LabeledPoint
    答:————
14.[单选题] 以下哪个不是Scala的数据类型()
    A.AnyRef
    B.Anything
    C.NULL
    D.Nothing
    答:————
15.[单选题] Spark GraphX中类Graph的reverse方法可以()
    A.反转图中所有边的方向
    B.按照设定条件取出子图
    C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
    D.合并边相同的属性
    答:————
16.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()
    A.完全图
    B.有向完全图
    C.无向图
    D.简单图
    答:————
17.[单选题] Graph类中如果根据边数据创建图,数据需要转换成RDD类型,应该用()方法
    A.Graph(vertices,edges, defaultVertexAttr)
    B.Graph.fromEdges(RDD], defaultValue)
    C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
    D.GraphLoader.edgeListFile(sc,filename)
    答:————
18.[单选题] spark-submit配置项中()表示启动的executor数量
    A.--num-executors NUM
    B.--executor-memory MEM
    C.--total-executor-cores NUM
    D.--executor-coures NUM
    答:————
19.[单选题] 以下算法中属于无监督学习算法的是()
    A.KNN算法
    B.逻辑回归
    C.随机森林
    D.Kmeans
    答:————
20.[单选题] Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()
    A.filter
    B.flatten
    C.grouby
    D.flatmap
    答:————
21.[单选题] 以下哪个函数可以求两个RDD差集 ()
    A.union
    B.substract
    C.intersection
    D.cartesian
    答:————
22.[单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
    A.filter
    B.foreach
    C.map
    D.mkString
    答:————
23.[单选题] Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法
    A.Graph(vertices,edges, defaultVertexAttr)
    B.Graph.fromEdges(RDD], defaultValue)
    C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
    D.GraphLoader.edgeListFile(sc,filename)
    答:————
24.[单选题] 以下哪个函数可以求两个RDD交集 ()
    A.union
    B.substract
    C.intersection
    D.cartesian
    答:————
25.[单选题] ()是Spark的数据挖掘算法库
    A.Spark Core
    B.BlinkDB
    C.GraphX
    D.Mllib
    答:————
26.[多选题] Scala中使用()方法来查看两个集合的交集元素
    A.Set.concat
    B.Set.&
    C.Set.&&
    D.Set.intersect
    答:————
27.[多选题] 以下哪个方法可以从集合中创建RDD()
    A.parallelize
    B.makeRDD
    C.textFile
    D.loadFile
    答:————
28.[多选题] 以下是机器学习的常用算法的是()
    A.回归算法
    B.聚类算法
    C.降维算法
    D.分类算法
    答:————
29.[多选题] Mllib实现了一些常见的机器学习算法和应用程序,包括()
    A.分类
    B.聚类
    C.降维
    D.回归
    答:————
30.[多选题] Spark是一个()计算框架
    A.快速
    B.分布式
    C.可扩展
    D.容错
    答:————
31.[多选题] MapReudce不适合()任务
    A.大数据计算
    B.迭代
    C.交互式
    D.离线分析
    答:————
32.[多选题] Spark创建DataFrame对象方式有()
    A.结构化数据文件
    B.外部数据库
    C.RDD
    D.Hive中的表
    答:————
33.[多选题] Spark的RDD持久化操作有()方式
    A.cache
    B.presist
    C.storage
    D.long
    答:————
34.[多选题] 以下哪个是Scala的数据类型()
    A.Any
    B.NULL
    C.Nothing
    D.AnyRef
    答:————
35.[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息
    A.select
    B.selectExpr
    C.col
    D.apply
    答:————
36.[判断题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除
    A.对
    B.错
    答:————
37.[判断题] RDD的map操作不会改变RDD的分区数目
    A.对
    B.错
    答:————
38.[判断题] RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
    A.对
    B.错
    答:————
39.[判断题] Scala是一种纯面向对象的语言,每个值都是对象。
    A.对
    B.错
    答:————
40.[判断题] MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。
    A.对
    B.错
    答:————
41.[判断题] PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作
    A.对
    B.错
    答:————
42.[判断题] RDD的filter过滤会将返回值为true的过滤掉
    A.对
    B.错
    答:————
43.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
    A.对
    B.错
    答:————
44.[判断题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
    A.对
    B.错
    答:————
45.[判断题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值
    A.对
    B.错
    答:————
46.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
    A.对
    B.错
    答:————
47.[判断题] RDD是一个可读写的数据结构
    A.对
    B.错
    答:————
48.[判断题] Scala中创建一个方法时经常用void表示该方法无返回值
    A.对
    B.错
    答:————
49.[判断题] RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。
    A.对
    B.错
    答:————
50.[判断题] Spark Streming中Dstream是一种抽象的离散流
    A.对
    B.错
    答:————

无忧答案网 附件是答案,请核对题目下载
页: [1]
查看完整版本: 20秋南开《大数据开发技术(二)》在线作业百分