作业帮 发表于 2020-9-1 13:39:04

《大数据导论》南开20春期末考核答案

《大数据导论》20春期末考核
1.[单选题] 大数据的特点不包含
答案资料下载请参考帮助中心说明
    A.数据体量大
    B.价值密度高
    C.处理速度快
    D.数据不统一
    答:——D——
2.[单选题] PaaS是()的简称
    A.软件即服务
    B.平台即服务
    C.基础设施即服务
    D.硬件即服务
    答:——B——
3.[单选题] IaaS是()的简称
    A.软件即服务
    B.平台即服务
    C.基础设施即服务
    D.硬件即服务
    答:——C——
4.[单选题] 购物篮问题是##的典型案例    东财答案请进 ap5u.com 或q761296021
    A.数据变换
    B.关联规则挖掘
    C.数据分类
    答:————
5.[单选题] 基础设施即服务的英文简称是
    A.IaaS
    B.PaaS
    C.SaaS
    答:————
6.[单选题] 数据清洗的方法不包括
    A.缺失值处理
    B.噪声数据清除
    C.一致性检查
    D.重复数据记录处理
    答:————
7.[单选题] 以下哪项不是数据可视化工具的特性()
    A.实时性
    B.简单操作
    C.更丰富的展现
    D.仅需一种数据支持方式即可
    答:————
8.[单选题] 下列哪个工具常用来开发移动友好地交互地图()
    A.Leaflet
    B.Visual.ly
    C.BPizza Pie Charts
    D.Gephi
    答:————
9.[单选题] SAN是一种()
    A.存储设备
    B.专为数据存储而设计构建的网络
    C.光纤交换机
    D.HBA
    答:————
10.[单选题] GFS中的文件切分成()的块进行存储
    A.32MB
    B.64MB
    C.128MB
    D.1G
    答:————
11.[多选题] 数据预处理的过程主要是
    A.数据清洗
    B.数据集成
    C.数据变换
    D.数据规约
    答:————
12.[多选题] 大数据时代预测人类移动行为的数据特点是
    A.多样化
    B.数据量大
    C.维数高
    D.变化快
    答:————
13.[多选题] 下列属于传统统计学展示方法的是()
    A.柱状图
    B.饼状图
    C.曲线图
    D.网络图
    答:————
14.[多选题] 百度大数据引擎主要包含三大组件()
    A.开放云
    B.数据工厂
    C.百度大脑。
    答:————
15.[多选题] 去除噪声使得数据光滑的技术主要有:
    A.分箱
    B.回归
    C.离群点分析
    答:————
16.[多选题] 大数据存储的特点与挑战有()
    A.容量问题
    B.延迟问题
    C.安全问题
    D.成本问题
    答:————
17.[多选题] 大数据在医疗中的应用有()
    A.流行性疾病预防
    B.慢性病健康管理
    C.临床决策支持
    D.医疗器械研发
    答:————
18.[多选题] 医疗大数据的来源主要包括()
    A.制药企业/生命科学
    B.临床医疗/实验室数据
    C.费用报销/利用率
    D.健康管理/社交网络
    答:————
19.[多选题] 数据分析的类型根据数据分析深度可以分为()
    A.描述性分析
    B.预测性分析s
    C.规则性分析
    答:————
20.[多选题] 数据处理的两种方法是##,##
    A.批处理
    B.流处理
    C.单个处理
    D.交叉处理
    答:————
21.[判断题] 所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
    A.对
    B.错
    答:————
22.[判断题] 关联分析是从有噪声的、模糊的、随机的海量数据中,挖掘出隐藏的、事先不知道、但是有潜在关联的信息或知识的过程。
    A.对
    B.错
    答:————
23.[判断题] 数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
    A.对
    B.错
    答:————
24.[判断题] 数据隐私和安全是大数据发展面临的挑战
    A.对
    B.错
    答:————
25.[判断题] 用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
    A.对
    B.错
    答:————
26.[判断题] 在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
    A.对
    B.错
    答:————
27.[判断题] 频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。
    A.对
    B.错
    答:————
28.[判断题] Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。
    A.对
    B.错
    答:————
29.[判断题] Spark的亮点是充分利用内存承载工作集,而且能保证容错。
    A.对
    B.错
    答:————
30.[判断题] Apriori算法扫描数据库的次数等于最大频繁项集的项数。
    A.对
    B.错
    答:————
31.[判断题] 高质量的数据是能够满足应用需求的数据。
    A.对
    B.错
    答:————
32.[判断题] 离群点检测的任务是识别特征显著不同于其他数据的观测值
    A.对
    B.错
    答:————
33.[判断题] 数据分析是大数据发展面临的挑战
    A.对
    B.错
    答:————
34.[判断题] 百度地图春节人口迂徙大数据.在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。
    A.对
    B.错
    答:————
35.[判断题] 用一个函数拟合数据来光滑数据称为回归。
    A.对
    B.错
    答:————
36.[问答题] 简述云计算的体系架构分层及每层的含义。
    答:————
37.[问答题]简述数据可视化的流程和步骤。
    答:————
38.[名词解释] 聚类分析
    答:————
39.[名词解释] 云存储
    答:————
40.[名词解释] NoSQL
    答:————

奥鹏南开考核答案无忧答案网整理
页: [1]
查看完整版本: 《大数据导论》南开20春期末考核答案