aopeng 发表于 2019-9-21 10:18:05

南开19秋(1709、1803、1809、1903、1909)《大数据开发技术(...

19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业
1.[单选题]Amazon Redshift属于()
奥鹏作业答案可以联系QQ 761296021
    A.关系数据库    B.键值数据库
    C.NoSQL数据库    D.数据仓库
    正确答案:——D——
2.[单选题]MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。
    A.投影
    B.差
    C.交
    D.并
    正确答案:——B——
3.[单选题]hadoop fs -() 命令可以显示指定的文件的详细信息
    A.ll
    B.ls
    C.dir
    D.show
    正确答案:——B——
4.[单选题]流数据采取()计算模式
    A.批量
    B.实时
    C.大数据
    D.动态
    正确答案:————
5.[单选题]MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
    A.Client
    B.Job Tracker    奥鹏无忧答案网q761296021
    C.Task
    D.Task Tracker
    正确答案:————
6.[单选题]Modest Maps是哪种可视化工具()
    A.信息图表
    B.地图工具
    C.时间线工具
    D.分析工具
    正确答案:————
7.[单选题]Hadoop中执行MapReduce任务不含哪种方式()。
    A.Mahout
    B.Hadoop jar
    C.Shell脚本
    D.Python
    正确答案:————
8.[单选题]大数据摩尔定律体现了大数据的哪个体征()。
    A.数据体量大
    B.数据产生速度快
    C.数据种类多
    D.数据计算快
    E.数据价值高
    正确答案:————
9.[单选题]UMP系统中面对中等规模用户如何进行资源调度()
    A.可以共享同一个MySQL实例
    B.每个用户独占一个MySQL实例
    C.会占用多个独立的MySQL实例
    D.随机分配MySQL实例
    正确答案:————
10.[单选题]优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()
    A.列族数据库
    B.键值数据库
    C.图数据库
    D.文档数据库
    正确答案:————
11.[单选题]HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
    A.edit
    B.edit.old
    C.FsImage
    D.EditLog
    正确答案:————
12.[单选题]词频计算就是典型的()运算。
    A.关系连接
    B.分组聚合
    C.关系代数
    D.矩阵
    正确答案:————
13.[单选题]HDFS中ClientProtocol的()方法通知名称节点关闭文件
    A.close
    B.finish
    C.exit
    D.complete
    正确答案:————
14.[单选题]R是哪种可视化工具()
    A.信息图表
    B.地图工具
    C.时间线工具
    D.分析工具
    正确答案:————
15.[单选题]针对流数据,“量子恒道”可处理每天()级的实时流数据
    A.TB
    B.PB
    C.GB
    D.MB
    正确答案:————
16.[单选题]以下说法不正确的是()。
    A.Zookeeper提供分布式锁之类的基本服务
    B.Mahout提供了分布式存储服务
    C.Flume提供了日志管理服务
    D.Sqoop主要被用于数据交互操作
    正确答案:————
17.[单选题]每个Region服务器存储
()个Region
    A.1
    B.10
    C.10-1000
    D.0
    正确答案:————
18.[单选题]HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
    A.Master
    B.Region
    C.Zookeeper
    D.Chubby
    正确答案:————
19.[单选题]关于MapReduce中Shuffle过程,说法错误的是()。
    A.Shuffle过程中为每个Map任务分配一个缓存
    B.Shuffle过程中分区默认采用哈希函数
    C.Shulle过程的合并会改变最终结果
    D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
    正确答案:————
20.[单选题]NoSQL中的CAP理论中的C代表()
    A.一致性
    B.可用性
    C.分区容忍性
    D.可扩展性
    正确答案:————
21.[单选题]hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
    A.cat
    B.append
    C.add
    D.write
    正确答案:————
22.[单选题]D3是哪种可视化工具()
    A.信息图表
    B.地图工具
    C.时间线工具
    D.分析工具
    正确答案:————
23.[单选题]UMP系通过()来实现实现数据路由的基本功能
    A.Controller服务器
    B.Procy服务器
    C.愚公系统
    D.Agent服务器
    正确答案:————
24.[单选题]HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
    A.大于
    B.小于
    C.等于
    D.大于等于
    正确答案:————
25.[单选题]NoSQL中的CAP理论中的P代表()
    A.一致性
    B.可用性
    C.分区容忍性
    D.可扩展性
    正确答案:————
26.[单选题]使用Amazon云环境部署Hadoop的说法中错误的是()。
    A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
    B.Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
    C.在EC2上运行Hadoop尤其适用于一些工作流
    D.Amazon EC2为Hadoop提供了存储服务
    正确答案:————
27.[单选题]Hbase中主服务器Master主要负责表和Region的管理工作
    A.Master
    B.Slaver
    C.Region
    D.客户端
    正确答案:————
28.[单选题]针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
    A.Time Tunnel
    B.Spark
    C.Super Mario
    D.Storm
    正确答案:————
29.[单选题]UMP系统借助于()来实现各个节点之间的通信
    A.Mnesia
    B.LVS
    C.RabbitMQ
    D.Zookeeper
    正确答案:————
30.[单选题]Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
    A.ShuffleGrouping
    B.AllGrouping
    C.GlobalGrouping
    D.FiedlsGrouping
    正确答案:————
31.[多选题]Hadoop集群的整体性能取决于哪些性能间的平衡
    A.CPU
    B.GPU
    C.内存
    D.存储
    E.网络
    正确答案:————
32.[多选题]MapReduce的main函数中设置输出类型的方法有()。
    A.setOutputKeyClass
    B.setOutputClass
    C.setOutputValueClass
    D.setKeyValueClass
    正确答案:————
33.[多选题]关系数据库与NoSQL数据库相比有哪些优势()
    A.支持事务ACID四性
    B.可以支持超大规模数据存储
    C.以完善的关系代数理论作为基础
    D.具有强大的横向扩展能力
    正确答案:————
34.[多选题]以下哪些是数据可视化分析工具()
    A.R
    B.Weka
    C.Gephi
    D.Tableau
    正确答案:————
35.[多选题]分布式文件系统的设计目的包括()。
    A.并发控制
    B.可伸缩性
    C.容错
    D.速度
    正确答案:————
36.[多选题]关于Map端Shuffle过程中的合并与归并,说法正确的是()。
    A.两个键值对和,如果合并,会得到
    B.合并不会改变最终结果
    C.两个键值对和,如果归并,会得到
    D.两个键值对和,如果归并,会得到>
    正确答案:————
37.[多选题]流计算系统的需求有()。
    A.实时性
    B.廉价
    C.高性能
    D.高带宽
    E.分布式
    正确答案:————
38.[多选题]以下亚马逊的产品中哪个属于计算部分
    A.EC2
    B.EBS
    C.S3
    D.ELB
    正确答案:————
39.[多选题]Storm中Topology里面组件可以是()。
    A.Spout
    B.Stream
    C.Tuple
    D.Bolt
    正确答案:————
40.[多选题]HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
    A.FsImage
    B.DataNode
    C.Block
    D.EditLog
    正确答案:————
41.[判断题]在伪分布式模式中,NameNode和DataNode是同一个节点。
    A.对
    B.错
    正确答案:————
42.[判断题]HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
    A.对
    B.错
    正确答案:————
43.[判断题]Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
    A.对
    B.错
    正确答案:————
44.[判断题]在Pregel中, “标志位”和输入消息队列是分开保存的
    A.对
    B.错
    正确答案:————
45.[判断题]Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
    A.对
    B.错
    正确答案:————
46.[判断题]在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
    A.对
    B.错
    正确答案:————
47.[判断题]早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架
    A.对
    B.错
    正确答案:————
48.[判断题]关系数据库的关键特性包括完善的事务机制和高效的查询机制
    A.对
    B.错
    正确答案:————
49.[判断题]对于每个顶点而言,Pregel只保存一份顶点值和边值,但是,会保存两份“标志位”和输入消息队列,分别用于当前超步和下一个超步
    A.对
    B.错
    正确答案:————
50.[判断题]UMP系统中的Mnesia不错支持事务
    A.对
    B.错
    正确答案:————
附件是答案 ,核对题目下载 微信761296021
页: [1]
查看完整版本: 南开19秋(1709、1803、1809、1903、1909)《大数据开发技术(...