22年5月东财《数据挖掘概论》单元作业三题目及答案
东财《数据挖掘概论》单元作业三1.[单选题] 通过聚集多个分类器的预测来提高分类准确率的技术称为( )。
答案资料下载请参考帮助中心说明
A.组合(ensemble)
B.聚集(aggregate)
C.合并(combination)
D.投票(voting)
2.[单选题] 关于k-均值和DBSCAN的比较,以下说法不正确的是( )。
A.K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
B.K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C.K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D.K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
3.[单选题] SVM方法中落在边缘侧面超平面上的任意训练元组,称为( )。 四川大学答案无忧答案网整理
A.最小边缘超平面
B.最大边缘超平面
C.横截面
D.支持向量
4.[单选题] ID3、C4.5和CART都采用的是( )方法。
A.贪心
B.回溯
C.动态规划
D.递归
5.[单选题] BIRCH是一种( )。
A.分类器
B.聚类算法
C.关联分析算法
D.特征选择算法
6.[单选题] ( )是用于处理因变量为分类变量的回归问题。
A.线性回归
B.岭回归
C.Lasso
D.逻辑回归
7.[单选题] 基于代表对象的聚类技术是( )。
A.k-均值
B.k-中心点
C.AGNES
D.DIANA
8.[单选题] 当不知道数据所带标签时,可以使用( )技术促使带同类标签的数据与带其他标签的数据相分离。
A.分类
B.聚类
C.关联分析
D.隐马尔可夫链
9.[单选题] ( )是对离散型变量(类标号)建立函数,预测未知的或缺失的数据。
A.聚类
B.分类
C.回归
D.关联规则
10.[单选题] 以下属于可伸缩聚类算法的是( )。
A.CURE
B.DENCLUE
C.CLIQUE
D.OPOSSUM
11.[多选题] 计算R2需要用到( )。
A.离差平方和
B.回归平方和
C.残差平方和
D.偏最小二乘法
12.[多选题] 以下关于决策树说法正确的有( )。
A.ID3、C4.5和CART都采用贪心(即非回溯的)方法
B.决策树以自顶向下递归的分治方式构造
C.随着树的构建,训练集递归地划分成较小的子集
D.决策树必须严格遵循二叉树进行分叉
13.[多选题] 聚类分析的应用包括( )。
A.商务智能
B.图像模式识别
C.Web搜索
D.生物学
14.[多选题] 回归方法主要分为( )。
A.线性回归
B.非线性回归
C.岭回归
D.Lasso
15.[多选题] 属于分类的方法有( )。
A.决策树
B.K近邻
C.朴素贝叶斯
D.逻辑回归
16.[判断题] 监督学习是训练数据集的类标志是已知的。( )
A.对
B.错
17.[判断题] 岭回归采用含有正则化参数的L2范数正则化。( )
A.对
B.错
18.[判断题] 聚类评估的外部指标适用于有标签数据,将聚类结果与已知类标签进行比。( )
A.对
B.错
19.[判断题] 在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
A.对
B.错
20.[判断题] 在决策树中,每个内部节点表示一个测试的输出。( )
A.对
B.错
核对题目下载 转载注明无忧答案网
页:
[1]