南开19秋（1709、1803、1809、1903、1909）《大数据开发技术（...-南开大学-无忧答案网

aopeng 发表于 2019-9-21 10:18:05

南开19秋（1709、1803、1809、1903、1909）《大数据开发技术（...

19秋学期（1709、1803、1809、1903、1909）《大数据开发技术（一）》在线作业
1.[单选题]Amazon Redshift属于()
奥鹏作业答案可以联系QQ 761296021
A.关系数据库 B.键值数据库
C.NoSQL数据库 D.数据仓库
正确答案:——D——
2.[单选题]MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。
A.投影
B.差
C.交
D.并
正确答案:——B——
3.[单选题]hadoop fs -() 命令可以显示指定的文件的详细信息
A.ll
B.ls
C.dir
D.show
正确答案:——B——
4.[单选题]流数据采取()计算模式
A.批量
B.实时
C.大数据
D.动态
正确答案:————
5.[单选题]MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A.Client
B.Job Tracker 奥鹏无忧答案网q761296021
C.Task
D.Task Tracker
正确答案:————
6.[单选题]Modest Maps是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
正确答案:————
7.[单选题]Hadoop中执行MapReduce任务不含哪种方式()。
A.Mahout
B.Hadoop jar
C.Shell脚本
D.Python
正确答案:————
8.[单选题]大数据摩尔定律体现了大数据的哪个体征()。
A.数据体量大
B.数据产生速度快
C.数据种类多
D.数据计算快
E.数据价值高
正确答案:————
9.[单选题]UMP系统中面对中等规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
正确答案:————
10.[单选题]优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
正确答案:————
11.[单选题]HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
A.edit
B.edit.old
C.FsImage
D.EditLog
正确答案:————
12.[单选题]词频计算就是典型的()运算。
A.关系连接
B.分组聚合
C.关系代数
D.矩阵
正确答案:————
13.[单选题]HDFS中ClientProtocol的()方法通知名称节点关闭文件
A.close
B.finish
C.exit
D.complete
正确答案:————
14.[单选题]R是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
正确答案:————
15.[单选题]针对流数据,“量子恒道”可处理每天()级的实时流数据
A.TB
B.PB
C.GB
D.MB
正确答案:————
16.[单选题]以下说法不正确的是()。
A.Zookeeper提供分布式锁之类的基本服务
B.Mahout提供了分布式存储服务
C.Flume提供了日志管理服务
D.Sqoop主要被用于数据交互操作
正确答案:————
17.[单选题]每个Region服务器存储
()个Region
A.1
B.10
C.10-1000
D.0
正确答案:————
18.[单选题]HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Master
B.Region
C.Zookeeper
D.Chubby
正确答案:————
19.[单选题]关于MapReduce中Shuffle过程,说法错误的是()。
A.Shuffle过程中为每个Map任务分配一个缓存
B.Shuffle过程中分区默认采用哈希函数
C.Shulle过程的合并会改变最终结果
D.Shuffle过程在Reduce端首先从Map端领取结果，然后执行归并操作，最后输送给Reduce任务进行处理。
正确答案:————
20.[单选题]NoSQL中的CAP理论中的C代表()
A.一致性
B.可用性
C.分区容忍性
D.可扩展性
正确答案:————
21.[单选题]hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A.cat
B.append
C.add
D.write
正确答案:————
22.[单选题]D3是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
正确答案:————
23.[单选题]UMP系通过()来实现实现数据路由的基本功能
A.Controller服务器
B.Procy服务器
C.愚公系统
D.Agent服务器
正确答案:————
24.[单选题]HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A.大于
B.小于
C.等于
D.大于等于
正确答案:————
25.[单选题]NoSQL中的CAP理论中的P代表()
A.一致性
B.可用性
C.分区容忍性
D.可扩展性
正确答案:————
26.[单选题]使用Amazon云环境部署Hadoop的说法中错误的是()。
A.Hadoop不仅可以运行在企业内部的集群中，也可以运行在云计算环境中
B.Hadoop自带有一套脚本，用于在EC2上面运行Hadoop
C.在EC2上运行Hadoop尤其适用于一些工作流
D.Amazon EC2为Hadoop提供了存储服务
正确答案:————
27.[单选题]Hbase中主服务器Master主要负责表和Region的管理工作
A.Master
B.Slaver
C.Region
D.客户端
正确答案:————
28.[单选题]针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A.Time Tunnel
B.Spark
C.Super Mario
D.Storm
正确答案:————
29.[单选题]UMP系统借助于()来实现各个节点之间的通信
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
正确答案:————
30.[单选题]Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
正确答案:————
31.[多选题]Hadoop集群的整体性能取决于哪些性能间的平衡
A.CPU
B.GPU
C.内存
D.存储
E.网络
正确答案:————
32.[多选题]MapReduce的main函数中设置输出类型的方法有()。
A.setOutputKeyClass
B.setOutputClass
C.setOutputValueClass
D.setKeyValueClass
正确答案:————
33.[多选题]关系数据库与NoSQL数据库相比有哪些优势()
A.支持事务ACID四性
B.可以支持超大规模数据存储
C.以完善的关系代数理论作为基础
D.具有强大的横向扩展能力
正确答案:————
34.[多选题]以下哪些是数据可视化分析工具()
A.R
B.Weka
C.Gephi
D.Tableau
正确答案:————
35.[多选题]分布式文件系统的设计目的包括()。
A.并发控制
B.可伸缩性
C.容错
D.速度
正确答案:————
36.[多选题]关于Map端Shuffle过程中的合并与归并,说法正确的是()。
A.两个键值对和，如果合并，会得到
B.合并不会改变最终结果
C.两个键值对和，如果归并，会得到
D.两个键值对和，如果归并，会得到>
正确答案:————
37.[多选题]流计算系统的需求有()。
A.实时性
B.廉价
C.高性能
D.高带宽
E.分布式
正确答案:————
38.[多选题]以下亚马逊的产品中哪个属于计算部分
A.EC2
B.EBS
C.S3
D.ELB
正确答案:————
39.[多选题]Storm中Topology里面组件可以是()。
A.Spout
B.Stream
C.Tuple
D.Bolt
正确答案:————
40.[多选题]HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A.FsImage
B.DataNode
C.Block
D.EditLog
正确答案:————
41.[判断题]在伪分布式模式中,NameNode和DataNode是同一个节点。
A.对
B.错
正确答案:————
42.[判断题]HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
A.对
B.错
正确答案:————
43.[判断题]Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
A.对
B.错
正确答案:————
44.[判断题]在Pregel中, “标志位”和输入消息队列是分开保存的
A.对
B.错
正确答案:————
45.[判断题]Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
A.对
B.错
正确答案:————
46.[判断题]在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
A.对
B.错
正确答案:————
47.[判断题]早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架
A.对
B.错
正确答案:————
48.[判断题]关系数据库的关键特性包括完善的事务机制和高效的查询机制
A.对
B.错
正确答案:————
49.[判断题]对于每个顶点而言,Pregel只保存一份顶点值和边值,但是,会保存两份“标志位”和输入消息队列,分别用于当前超步和下一个超步
A.对
B.错
正确答案:————
50.[判断题]UMP系统中的Mnesia不错支持事务
A.对
B.错
正确答案:————
附件是答案，核对题目下载微信761296021

页: [1]

无忧答案网's Archiver

南开19秋（1709、1803、1809、1903、1909）《大数据开发技术（...