100分 发表于 2022-5-13 10:47:43

22年5月东财《数据挖掘概论》单元作业三题目及答案

东财《数据挖掘概论》单元作业三
1.[单选题] 通过聚集多个分类器的预测来提高分类准确率的技术称为( )。
答案资料下载请参考帮助中心说明
    A.组合(ensemble)
    B.聚集(aggregate)
    C.合并(combination)
    D.投票(voting)
2.[单选题] 关于k-均值和DBSCAN的比较,以下说法不正确的是( )。
    A.K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
    B.K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
    C.K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
    D.K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
3.[单选题] SVM方法中落在边缘侧面超平面上的任意训练元组,称为( )。    四川大学答案无忧答案网整理
    A.最小边缘超平面
    B.最大边缘超平面
    C.横截面
    D.支持向量
4.[单选题] ID3、C4.5和CART都采用的是( )方法。
    A.贪心
    B.回溯
    C.动态规划
    D.递归
5.[单选题] BIRCH是一种( )。
    A.分类器
    B.聚类算法
    C.关联分析算法
    D.特征选择算法
6.[单选题] ( )是用于处理因变量为分类变量的回归问题。
    A.线性回归
    B.岭回归
    C.Lasso
    D.逻辑回归
7.[单选题] 基于代表对象的聚类技术是( )。
    A.k-均值
    B.k-中心点
    C.AGNES
    D.DIANA
8.[单选题] 当不知道数据所带标签时,可以使用( )技术促使带同类标签的数据与带其他标签的数据相分离。
    A.分类
    B.聚类
    C.关联分析
    D.隐马尔可夫链
9.[单选题] ( )是对离散型变量(类标号)建立函数,预测未知的或缺失的数据。
    A.聚类
    B.分类
    C.回归
    D.关联规则
10.[单选题] 以下属于可伸缩聚类算法的是( )。
    A.CURE
    B.DENCLUE
    C.CLIQUE
    D.OPOSSUM
11.[多选题] 计算R2需要用到( )。
    A.离差平方和
    B.回归平方和
    C.残差平方和
    D.偏最小二乘法
12.[多选题] 以下关于决策树说法正确的有( )。
    A.ID3、C4.5和CART都采用贪心(即非回溯的)方法
    B.决策树以自顶向下递归的分治方式构造
    C.随着树的构建,训练集递归地划分成较小的子集
    D.决策树必须严格遵循二叉树进行分叉
13.[多选题] 聚类分析的应用包括( )。
    A.商务智能
    B.图像模式识别
    C.Web搜索
    D.生物学
14.[多选题] 回归方法主要分为( )。
    A.线性回归
    B.非线性回归
    C.岭回归
    D.Lasso
15.[多选题] 属于分类的方法有( )。
    A.决策树
    B.K近邻
    C.朴素贝叶斯
    D.逻辑回归
16.[判断题] 监督学习是训练数据集的类标志是已知的。( )
    A.对
    B.错
17.[判断题] 岭回归采用含有正则化参数的L2范数正则化。( )
    A.对
    B.错
18.[判断题] 聚类评估的外部指标适用于有标签数据,将聚类结果与已知类标签进行比。( )
    A.对
    B.错
19.[判断题] 在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
    A.对
    B.错
20.[判断题] 在决策树中,每个内部节点表示一个测试的输出。( )
    A.对
    B.错

核对题目下载 转载注明无忧答案网
页: [1]
查看完整版本: 22年5月东财《数据挖掘概论》单元作业三题目及答案