端木老师 发表于 2020-4-22 09:48:43

20春南开《大数据开发技术(一)》(1709、1803、1809、1903...

20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(一)》在线作业
1.[单选题] 应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
奥鹏作业答案可以联系QQ 761296021
    A.列族数据库
    B.键值数据库
    C.图数据库
    D.文档数据库
    正确答案:——C——
2.[单选题] 每个Region服务器存储
()个Region
    A.1
    B.10
    C.10-1000
    D.0
    正确答案:——C——
3.[单选题] 针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
    A.Time Tunnel
    B.Spark
    C.Super Mario
    D.Storm
    正确答案:——C——
4.[单选题] Pregel计算模型中每个顶点ID的类型是()
    A.String
    B.Int
    C.Double
    D.结构体
    正确答案:————
5.[单选题] Google Cloud SQL是谷歌公司推出的基于()的云数据库
    A.MySQL
    B.SQL Server
    C.Hbase
    D.Oracle
    正确答案:————
6.[单选题] 以下哪种属于列族数据库()
    A.MongoDB
    B.Redis
    C.Hbase    Q 7 612 96021
    D.Neo4j
    正确答案:————
7.[单选题] BigTable采用()作为底层数据存储
    A.HDFS
    B.GFS
    C.Hbase
    D.传统文件系统
    正确答案:————
8.[单选题] UMP系通过()来实现实现管理每台物理机上的MySQL实例
    A.Controller服务器
    B.Procy服务器
    C.愚公系统
    D.Agent服务器
    正确答案:————
9.[单选题] 以下亚马逊的产品中哪个是键值数据库
    A.RDS
    B.SimpleDB
    C.DynamoDB
    D.Redshift
    正确答案:————
10.[单选题] 以下亚马逊的产品中哪个是NoSQL数据库
    A.RDS
    B.SimpleDB
    C.DynamoDB
    D.Redshift
    正确答案:————
11.[单选题] 以下针对Hive的说法不正确的是()。
    A.Hive是一个基于Hadoop的数据仓库工具
    B.Hive是关系数据库
    C.Hive QL是一种查询语言
    D.Hive可以提供查询分析存储等功能
    正确答案:————
12.[单选题] 词频计算就是典型的()运算。
    A.关系连接
    B.分组聚合
    C.关系代数
    D.矩阵
    正确答案:————
13.[单选题] Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
    A.ShuffleGrouping
    B.AllGrouping
    C.GlobalGrouping
    D.FiedlsGrouping
    正确答案:————
14.[单选题] HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
    A.Master
    B.Region
    C.Zookeeper
    D.Chubby
    正确答案:————
15.[单选题] Hbase中采用()保证系统出错时及时恢复
    A.MemStore
    B.Hlog
    C.StoreFile
    D.客户端
    正确答案:————
16.[单选题] 对于不同顶点之间的信息交换,Pregel采用了()
    A.远程数据读取
    B.共享内存
    C.纯消息传递模型
    D.共享消息
    正确答案:————
17.[单选题] HDFS中FSDataInputStream封装了()
    A.HDFSInputStream
    B.DFSInputStream
    C.DataInputStream
    D.FSInputStream
    正确答案:————
18.[单选题] 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
    A.动态
    B.存量
    C.实时
    D.静态
    正确答案:————
19.[单选题] MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
    A.M
    B.N
    C.M-1
    D.N-1
    正确答案:————
20.[单选题] SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
    A.Client Layer
    B.Services Layer
    C.Platform Layer
    D.Infrastructure Layer
    正确答案:————
21.[单选题] Amazon Redshift属于()
    A.关系数据库
    B.键值数据库
    C.NoSQL数据库
    D.数据仓库
    正确答案:————
22.[单选题] UMP系统借助于()来实现集群内部的负载均衡
    A.Mnesia
    B.LVS
    C.RabbitMQ
    D.Zookeeper
    正确答案:————
23.[单选题] 以下说法不正确的是()。
    A.MapReduce的核心思想就是“分面治之”
    B.HDFS是对GFS的开源实现
    C.MapReduce是一种分布式计算模型
    D.HDFS采用HBase作为其底层数据存储
    正确答案:————
24.[单选题] 以下哪个不属于MongoDB的特点
    A.提供了面向文档的存储
    B.可以设置任何属性索引
    C.具有很好的垂直可扩展性
    D.支持丰富的查询表达式
    正确答案:————
25.[单选题] 信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
    A.信息处理
    B.信息增长
    C.信息爆炸
    D.信息传输
    正确答案:————
26.[单选题] NoSQL中的CAP理论中的P代表()
    A.一致性
    B.可用性
    C.分区容忍性
    D.可扩展性
    正确答案:————
27.[单选题] 批处理系统关注(),流处理系统关注()。
    A.吞吐率,延时
    B.延时,吞吐率
    C.延时,速度
    D.速度,吞吐率
    正确答案:————
28.[单选题] MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
    A.Client
    B.Job Tracker
    C.Task
    D.Task Tracker
    正确答案:————
29.[单选题] 以下属于Hadoop2.0的特性是()。
    A.MapReduce
    B.HDFS
    C.YARN
    D.SPARK
    正确答案:————
30.[单选题] MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
    A.数据向计算靠拢
    B.计算向数据靠拢
    C.计算向网络靠拢
    D.计算与数据并行
    正确答案:————
31.[多选题] 大数据的特征是()。
    A.数据体量大
    B.数据产生速度快
    C.数据种类多
    D.数据计算快
    E.数据价值高
    正确答案:————
32.[多选题] 关系数据库与NoSQL数据库相比有哪些优势()
    A.支持事务ACID四性
    B.可以支持超大规模数据存储
    C.以完善的关系代数理论作为基础
    D.具有强大的横向扩展能力
    正确答案:————
33.[多选题] 流计算系统的需求有()。
    A.实时性
    B.廉价
    C.高性能
    D.高带宽
    E.分布式
    正确答案:————
34.[多选题] 哪些属于数据可视化的重要作用()
    A.分析数据
    B.采集数据
    C.辅助理解数据
    D.观测跟踪数据
    正确答案:————
35.[多选题] 以下亚马逊的产品中哪个属于计算部分
    A.EC2
    B.EBS
    C.S3
    D.ELB
    正确答案:————
36.[多选题] 以下哪个不是云数据库的特点
    A.高可扩展性
    B.高可用性
    C.支持资源有效分发
    D.本地存储
    正确答案:————
37.[多选题] 流计算是针对流数据的实时计算,可以应用在()场景中
    A.广告投放
    B.气候模拟预测
    C.机器翻译
    D.推荐系统
    正确答案:————
38.[多选题] 以下哪些是数据可视化分析工具()
    A.R
    B.Weka
    C.Gephi
    D.Tableau
    正确答案:————
39.[多选题] 以下哪些是数据可视化地图工具()
    A.Google Fusion Tables
    B.Modest Maps
    C.Leaflet
    D.Google Chart API
    正确答案:————
40.[多选题] 以下亚马逊的产品中哪个属于存储部分
    A.EC2
    B.EBS
    C.S3
    D.ELB
    正确答案:————
41.[判断题] 数据产生方式的运营式系统阶段的数据产生方式是主动的。
    A.对
    B.错
    正确答案:————
42.[判断题] 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
    A.对
    B.错
    正确答案:————
43.[判断题] 对于每个顶点而言,Pregel只保存一份顶点值和边值,但是,会保存两份“标志位”和输入消息队列,分别用于当前超步和下一个超步
    A.对
    B.错
    正确答案:————
44.[判断题] 云数据库不可以满足企业动态变化的数据存储需求
    A.对
    B.错
    正确答案:————
45.[判断题] Ambari通过Web进行Hadoop集群的管理配置。
    A.对
    B.错
    正确答案:————
46.[判断题] 在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
    A.对
    B.错
    正确答案:————
47.[判断题] Facebook主要将Hadoop平台用于日志处理、推荐系统等方面
    A.对
    B.错
    正确答案:————
48.[判断题] 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。
    A.对
    B.错
    正确答案:————
49.[判断题] Hbase和传统数据库一样都是列式数据库
    A.对
    B.错
    正确答案:————
50.[判断题] HBase只有一个索引——行键,通过巧妙的设计,HBase中的所有访问方法,或者通过行键访问,或者通过行键扫描,从而使得整个系统不会慢下来
    A.对
    B.错
    正确答案:————

无忧答案网,附件是答案,请核对题目下载

页: [1]
查看完整版本: 20春南开《大数据开发技术(一)》(1709、1803、1809、1903...