南开18秋(1703)《数据挖掘》在线作业题目
18秋学期(1703)《数据挖掘》在线作业随机作业核对题目下载答案
1.[单选题]()的基本思想是将每个数据值映射成一个带颜色的像素,根据数据集的维数把屏幕分为若干个子窗口,每个子窗口显示数据的一维。 (满分:)
A. 数据可视化技术 B. 数据库系统
C. 基于图符的可视化技术 D. 像素可视化技术
正确答案:——D——
2.[单选题]()是说给定属性的每个值都必须不同于该属性的其他值。 (满分:)
A. 唯一性规则
B. 连续性规则
C. 空值规则
D. 解释性规则
正确答案:——A——
3.[单选题]()的基本思想,是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。 (满分:)
A. 数据可视化技术
B. 数据库系统
C. 基于图符的可视化技术
D. 像素可视化技术
正确答案:——A——
4.[单选题]()是影响数据质量的因素,反映数据是否容易理解。 (满分:)
A. 时效性
B. 可信性
C. 可解释性
D. 正确性
正确答案:————
5.[单选题]分位数是取自数据分布的每隔一定间隔上的点,把数据划分成基本上大小相等的连贯集合。如:4-分位数是()个数据点,它们把数据分布划分成4个相等的部分,使得每部分表示数据分布的四分之一。 (满分:)
A. 1
B. 2
C. 3
D. 4
正确答案:————
6.[单选题]检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。 (满分:)
A. 统计方法
B. 邻近度 奥鹏作业答案
C. 密度
D. 聚类技术
正确答案:————
7.[单选题]()是一项探测大量数据以发现有意义的模式(pattern)和规则(rule)的业务流程(businessprocess)。 (满分:)
A. 数据分析
B. 数据挖掘
C. 聚类
D. 分类
正确答案:————
8.[单选题]下面哪个不属于数据的属性类型?() (满分:)
A. 标称
B. 序数
C. 区间
D. 相异
正确答案:————
9.[单选题]决策树中不包含以下哪种结点?() (满分:)
A. 根结点(rootnode)
B. 内部结点(internalnode)
C. 外部结点(externalnode)
D. 叶结点(leafnode)
正确答案:————
10.[单选题]数据分析主要采用的是()的技术。 (满分:)
A. 统计学
B. 机器学习
C. 人工智能
D. 数据库
正确答案:————
11.[单选题]考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。 (满分:)
A. 1,2,3,4
B. 1,2,3,5
C. 1,2,4,5
D. 1,3,4,5
正确答案:————
12.[单选题]离群点分析使用基于()的技术,把可能的离群点看做与其他对象高度相异的对象。 (满分:)
A. 分类
B. 聚类
C. 离散
D. 可视化
正确答案:————
13.[单选题]OLAM技术一般简称为“数据联机分析挖掘”,下面说法正确的是()。 (满分:)
A. OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性
B. 由于OLAM的立方体和用于OLAP的立方体有本质的区别
C. 基于WEB的OLAM是WEB技术与OLAM技术的结合
D. OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作
正确答案:————
14.[单选题]()是一种属性,其可能的值之间具有有意义的序或秩评定(ranking),但是相继值之间的差是未知的。 (满分:)
A. 标称属性
B. 序数属性
C. 数值属性
D. 离散属性
正确答案:————
15.[单选题]在基于图的簇评估度量表里面,如果簇度量为proximity(Ci,C),簇权值为mi,那么它的类型是()。 (满分:)
A. 基于图的凝聚度
B. 基于原型的凝聚度
C. 基于原型的分离度
D. 基于图的凝聚度和分离度
正确答案:————
16.[单选题]为了发现任意形状的聚类结果,提出了()的聚类方法。这类方法将簇看作是数据空间中被低密度区域分割开的高密度对象区域。 (满分:)
A. 基于密度
B. 基于网格
C. 基于模型
D. 层次方法
正确答案:————
17.[单选题]()是定量的,是可度量的量,用整数或实数值表示,也可以是区间标度的或比率标度的。 (满分:)
A. 标称属性
B. 序数属性
C. 数值属性
D. 二元属性
正确答案:————
18.[单选题]考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()。 (满分:)
A. 0.75
B. 0.35
C. 0.468
D. 0.574
正确答案:————
19.[单选题]关于K均值和DBSCAN的比较,以下说法不正确的是()。 (满分:)
A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。
B. K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。
C. K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。
D. K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。
正确答案:————
20.[单选题]()的首要挑战是设法解决如何在二维显示上可视化高维空间。 (满分:)
A. 数据可视化技术
B. 几何投影技术
C. 基于图符的可视化技术
D. 像素可视化技术
正确答案:————
二、多选题:
21.[多选题]对于挖掘的应用,数据的最基本形式是()。 (满分:)
A. 数据库数据
B. 数据仓库数据
C. 事务数据
D. 抽样数据
正确答案:————
22.[多选题]()都属于簇有效性的监督度量。 (满分:)
A. 轮廓系数
B. 共性分类相关系数
C. 熵
D. F度量
正确答案:————
23.[多选题]非频繁模式()。 (满分:)
A. 其支持度小于阈值
B. 都是不让人感兴趣的
C. 包含负模式和负相关模式
D. 对异常数据项敏感
正确答案:————
24.[多选题]离群点的类型包括:()。 (满分:)
A. 全局离群点
B. 情境离群点
C. 集体离群点
D. 单独离群点
正确答案:————
25.[多选题]在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:()。 (满分:)
A. 忽略元组
B. 使用一个全局常量填充空缺值
C. 使用属性的平均值填充空缺值
D. 使用与给定元组属同一类的所有样本的平均值
正确答案:————
26.[多选题]()这些数据特性都是对聚类分析具有很强影响的。 (满分:)
A. 高维性
B. 规模
C. 稀疏性
D. 噪声和离群点
正确答案:————
27.[多选题]Apriori算法的计算复杂度受()影响。 (满分:)
A. 支持度阀值
B. 项数
C. 事务数
D. 事务平均宽度
正确答案:————
28.[多选题]数据预处理的原因:数据多半来自多个异种数据源,极易受()数据的侵扰,低质量的数据将导致低质量的挖掘结果。因此需要对数据进行预处理。 (满分:)
A. 受噪声
B. 不一致
C. 缺失值
D. 正确
正确答案:————
29.[多选题]通过数据挖掘过程所推导出的关系和摘要经常被称为:()。 (满分:)
A. 模型
B. 模式
C. 模范
D. 模具
正确答案:————
30.[多选题]()都导致不正确的数据。 (满分:)
A. 缺失值
B. 噪声
C. 不一致性
D. 分层
正确答案:————
三、判断题:
31.[判断题]频繁项集指满足最小支持度的项集,是挖掘关联规则的基本条件之一。 (满分:)
T. 对
F. 错
正确答案:————
32.[判断题]数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。 (满分:)
T. 对
F. 错
正确答案:————
33.[判断题]孤立点指数据库中包含的一些与数据的一般行为或模型不一致的异常数据。 (满分:)
T. 对
F. 错
正确答案:————
34.[判断题]对于记录不能客观度量的主观质量评估,序数属性是有用的。因此,序数属性通常用于等级评定调查。如:顾客满意度调查。 (满分:)
T. 对
F. 错
正确答案:————
35.[判断题]规范化是数据变换的一种策略,把属性数据按比例缩放,使之落入一个特定的小区间,如-1.0~1.0或0.0~1.0。 (满分:)
T. 对
F. 错
正确答案:————
36.[判断题]不正确的数据也可能是由命名约定或所用的数据代码不一致,或输入字段的格式不一致而导致的。 (满分:)
T. 对
F. 错
正确答案:————
37.[判断题]标签云是关键词的视觉化描述,用于汇总用户生成的标签。标签一般是独立的词汇,常常按字母顺序排列,其重要程度又能通过改变字体大小或颜色来表现,大多数标签本身就是超级链接,直接指向与标签相联的一系列条目。 (满分:)
T. 对
F. 错
正确答案:————
38.[判断题]由标称数据产生概念分层是一种数据变换策略,属性,如street,可以泛化到较高的概念层,如city或country。许多标称属性的概念分层都蕴含在数据库的模式中,可以在模式定义级自动定义。 (满分:)
T. 对
F. 错
正确答案:————
39.[判断题]OLTP系统管理历史的数据,而OLAP管理当前数据。 (满分:)
T. 对
F. 错
正确答案:————
40.[判断题]销售部门不知道如何解释数据。即便该数据库现在是正确的、完整的、一致的、及时的,但是由于很差的可信性和可解释性,销售部门的用户仍然可能把它看成低质量的数据。 (满分:)
T. 对
F. 错
正确答案:————
41.[判断题]可视化为探索数据提供了有效的工具,可视化也可以用于表现挖掘过程、从挖掘方法得到的模式,以及用户与数据交互。 (满分:)
T. 对
F. 错
正确答案:————
42.[判断题]商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。 (满分:)
T. 对
F. 错
正确答案:————
43.[判断题]规划挖掘(planmining)就是从规划库中挖掘出有意义的模式或知识。规划挖掘有很多用途,例如可从飞行数据库中发现商务乘客旅行模式。 (满分:)
T. 对
F. 错
正确答案:————
44.[判断题]Web结构挖掘使用图和网络挖掘的理论和方法来分析网上的节点和链接结构,还可以挖掘页面内文档结构,例如:分析页面结构的树状结构,描述HTML标签的用法等。 (满分:)
T. 对
F. 错
正确答案:————
45.[判断题]分类是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标号未知的对象的类标号。 (满分:)
T. 对
F. 错
正确答案:————
46.[判断题]数据挖掘是通过构建模型来完成的。从某种词义来看,模型是对事物如何工作的一种解释或说明,其足以反映现实,从而可以用来对现实世界进行推理。 (满分:)
T. 对
F. 错
正确答案:————
47.[判断题]决策树分类器的构造不需要任何领域知识或参数设置,因此适合于探测式知识发现。 (满分:)
T. 对
F. 错
正确答案:————
48.[判断题]数据归约是将原始数据转换成为适合数据挖掘的形式。 (满分:)
T. 对
F. 错
正确答案:————
49.[判断题]数据分类在分类阶段,检验数据用于评估分类规则的准确率,如果准确率可以接受,则规则用于新的元祖分类。 (满分:)
T. 对
F. 错
正确答案:————
50.[判断题]数据挖掘是对数据进行处理和研究,并从数据中提取有用信息和发现知识的过程。 (满分:)
T. 对
F. 错
正确答案:————
附件是答案需要的自助下载 q761296021
页:
[1]