南开大学《大数据导论》19秋期末考核
《大数据导论》19秋期末考核1.[单选题] 以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
正确答案:——B——
2.[单选题] ()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
D.EXCEL
正确答案:——D——
3.[单选题] 数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
正确答案:——D——
4.[单选题] 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
正确答案:————
5.[单选题] 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:————
6.[单选题] 下列不属于Google云计算平台技术架构的是()
A.并行数据处理MapReduce
B.分布式锁Chubby
C.结构化数据表BigTable
D.弹性云计算EC2
正确答案:————
7.[单选题] 大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确答案:————
8.[单选题] IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:————
9.[单选题] 基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
正确答案:————
10.[单选题] 下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
正确答案:————
11.[多选题] 数据归约(Data Reduction)主要有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
正确答案:————
12.[多选题] 以下可以用于数据可视化的是()。
A.R语言
B.Excel
C.RapidMiner
D.Weka
正确答案:————
13.[多选题] 医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A.多态性
B.时效性
C.不完整性
D.冗余性
正确答案:————
14.[多选题] 大数据存储的特点与挑战有()
A.容量问题
B.延迟问题
C.安全问题
D.成本问题
正确答案:————
15.[多选题] 大数据智能感知层:主要包括()及软硬件资源接入系统
A.数据传感体系
B.网络通信体系
C.传感适配体系
D.智能识别体系
正确答案:————
16.[多选题] 数据预处理的过程主要是
A.数据清洗
B.数据集成
C.数据变换
D.数据规约
正确答案:————
17.[多选题] 交通数据处理包括以下几个步骤()
A.数据清洗
B.数据映射
C.数据组织
D.数据聚类
正确答案:————
18.[多选题] 数据工厂包括
A.低能耗数据中心
B.超大规模讲分布式架构
C.新一代智能自动化运维
D.超强云安全
正确答案:————
19.[多选题] 可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
正确答案:————
20.[多选题] 去除噪声使得数据光滑的技术主要有:
A.分箱
B.回归
C.离群点分析
正确答案:————
21.[判断题] 在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
A.对
B.错
正确答案:————
22.[判断题] 每个簇的质心(centroid)是该簇中所有数据对象的均值。
A.对
B.错
正确答案:————
23.[判断题] 数据存储要表现出静态数据的特征,反映的是系统中静止的数据。
A.对
B.错
正确答案:————
24.[判断题] 不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
A.对
B.错
正确答案:————
25.[判断题] Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。
A.对
B.错
正确答案:————
26.[判断题] 未来考验零售企业的是如何挖掘消费者需求
A.对
B.错
正确答案:————
27.[判断题] 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。
A.对
B.错
正确答案:————
28.[判断题] 数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
A.对
B.错
正确答案:————
29.[判断题] Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
A.对
B.错
正确答案:————
30.[判断题] FP算法比Apriori算法慢
A.对
B.错
正确答案:————
31.[判断题] 轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
A.对
B.错
正确答案:————
32.[判断题] Apriori算法扫描数据库的次数等于最大频繁项集的项数。
A.对
B.错
正确答案:————
33.[判断题] Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的“数据乐园”。人们越来愈倾向于在Facebook上表达自己的情绪。
A.对
B.错
正确答案:————
34.[判断题] 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。
A.对
B.错
正确答案:————
35.[判断题] R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
A.对
B.错
正确答案:————
36.[问答题]简述数据可视化的流程和步骤。
正确答案:————
37.[问答题] 简述网络大数据的一般采集过程。
正确答案:————
38.[名词解释] NoSQL
正确答案:————
39.[名词解释] 批处理
正确答案:————
40.[名词解释] 数据清洗
正确答案:————
41.[名词解释] 结构化数据
正确答案:————
页:
[1]