南开19秋学期《大数据导论》在线作业
19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业1.[单选题] 医疗健康数据的基本情况不包括以下哪项?
A.诊疗数据
B.个人健康管理数据
C.公共安全数据
D.健康档案数据
正确答案:——C——
2.[单选题] 数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:——C——
3.[单选题] 大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
正确答案:——D——
4.[单选题] 哪个选项不属于大数据4V特点?
A.Volume
B.Valid
C.Variety
D.Value
正确答案:————
5.[单选题] 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
正确答案:————
6.[单选题] 下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源
B.大数据技术创新取得明显突破
C.大数据应用推动势头良好
D.大数据产业支撑薄弱
正确答案:————
7.[单选题] 基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
正确答案:————
8.[单选题] 下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:————
9.[单选题] MapReduce中的Map和Reduce函数使用()进行输入输出
A.key/value对
B.随机数值
C.其他计算结果
正确答案:————
10.[单选题] 大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确答案:————
11.[单选题] 下列不属于Google云计算平台技术架构的是()
A.并行数据处理MapReduce
B.分布式锁Chubby
C.结构化数据表BigTable
D.弹性云计算EC2
正确答案:————
12.[单选题] 以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
正确答案:————
13.[单选题] ()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
D.EXCEL
正确答案:————
14.[单选题] 数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
正确答案:————
15.[单选题] DAS代表的意思是()
A.两个异步存储
B.数据归档软件
C.连接一个可选的存储
D.直连存储
正确答案:————
16.[多选题] 大数据智能感知层:主要包括()及软硬件资源接入系统
A.数据传感体系
B.网络通信体系
C.传感适配体系
D.智能识别体系
正确答案:————
17.[多选题] 层次方法可以分为()
A.K均值算法
B.K中心点算法
C.凝聚法
D.分裂法
正确答案:————
18.[多选题] 以下可以用于数据可视化的是()。
A.R语言
B.Excel
C.RapidMiner
D.Weka
正确答案:————
19.[多选题] 社会信号数据的特点有()
A.规模大
B.空间覆盖率广
C.监测时间长
D.实时性
正确答案:————
20.[多选题] 大数据在医疗中的应用有()
A.流行性疾病预防
B.慢性病健康管理
C.临床决策支持
D.医疗器械研发
正确答案:————
21.[多选题] 对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。
A.欧式距离
B.相关系数
C.协方差
正确答案:————
22.[多选题] 数据变换的常用方法有##,##,##,##
A.中心化变换
B.极差规格化变换
C.标准化变换
D.对数变换
正确答案:————
23.[多选题] 数据清洗(Data Cleaning)的方法有()
A.填充空缺值
B.清除数据中的噪声
C.识别或删除离群点并解决不一致性
正确答案:————
24.[多选题] 数据处理的两种方法是##,##
A.批处理
B.流处理
C.单个处理
D.交叉处理
正确答案:————
25.[多选题] 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A.用户行为数据
B.日志式的活动数据
C.事件信息
正确答案:————
26.[多选题] 去除噪声使得数据光滑的技术主要有:
A.分箱
B.回归
C.离群点分析
正确答案:————
27.[多选题] 常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
正确答案:————
28.[多选题] 下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
正确答案:————
29.[多选题] 可使用##,##,##进行光滑。
A.最大值
B.箱中位数
C.箱边界
D.箱均值
正确答案:————
30.[多选题] 网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A.网络爬虫
B.网站公开API
C.手动获取
正确答案:————
31.[判断题] 分类是在给定数据基础上构建分类函数或分类模型,将数据划分到预定义的目标类中的某一种类别。
A.对
B.错
正确答案:————
32.[判断题] 规则性分析(Prescriptive Analysis)用于解决决策制定和提高分析效率
A.对
B.错
正确答案:————
33.[判断题] 原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。
A.对
B.错
正确答案:————
34.[判断题] 广播变量在广播后可以修改
A.对
B.错
正确答案:————
35.[判断题] FP-growth算法需要对数据库进行3次扫描
A.对
B.错
正确答案:————
36.[判断题] 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。
A.对
B.错
正确答案:————
37.[判断题] IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
A.对
B.错
正确答案:————
38.[判断题] NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A.对
B.错
正确答案:————
39.[判断题] 分布式系统基础架构Hadoop的出现,为大数据带来了新的曙光;
A.对
B.错
正确答案:————
40.[判断题] 不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
A.对
B.错
正确答案:————
41.[判断题] 韩国政府利用位置信息和通话记录数据,规划出合理的公交线路,提升了政府科学决策和公共服务水平,提高了公众满意度。
A.对
B.错
正确答案:————
42.[判断题] 大数据分为“结构化数据“与”非结构化数据”和“半结构化数据”。
A.对
B.错
正确答案:————
43.[判断题] 在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
A.对
B.错
正确答案:————
44.[判断题] 数据共享联盟有望逐步壮大,成为产业、科研和学术界一个环环相扣的支撑环节和产业发展的核心环节。
A.对
B.错
正确答案:————
45.[判断题] 分类是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。
组内相似度高,组间差异性大。
A.对
B.错
正确答案:————
46.[判断题] 数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
A.对
B.错
正确答案:————
47.[判断题] 云存储中用户需要按需付费并使用存储服务
A.对
B.错
正确答案:————
48.[判断题] 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
A.对
B.错
正确答案:————
49.[判断题] 噪声(noise)是被测量变量的随机误差或方差。
A.对
B.错
正确答案:————
50.[判断题] 数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。
A.对
B.错
正确答案:————
页:
[1]