《数据科学导论》南开19秋期末考核
《数据科学导论》19秋期末考核1.[单选题]通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
奥鹏作业答案可以联系QQ 761296021
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化
正确答案:——C——
2.[单选题]利用最小二乘法对多元线性回归进行参数估计时,其目标为()。
A.最小化方差#最小化标准差
B.最小化残差平方和
C.最大化信息熵
正确答案:——C——
3.[单选题]为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。
A.1
B.2
C.3
D.4
正确答案:——B——
4.[单选题]对于k近邻法,下列说法错误的是()。
A.不具有显式的学习过程
B.适用于多分类任务
C.k值越大,分类效果越好
D.通常采用多数表决的分类决策规则
正确答案:————
5.[单选题]以下属于关联分析的是( )
A.CPU性能预测
B.购物篮分析
C.自动判断鸢尾花类别 QQ 76 129 6021
D.股票趋势建模
正确答案:————
6.[单选题]数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值
正确答案:————
7.[单选题]在一元线性回归模型中,残差项服从()分布。
A.泊松
B.正态
C.线性
D.非线性
正确答案:————
8.[单选题]手肘法的核心指标是()。
A.SES
B.SSE
C.RMSE
D.MSE
正确答案:————
9.[单选题]数据质量检验的主要任务就是检查原始数据中是否存在“脏数据”,概括性来说,脏数据不包括以下()
A.普通值
B.异常值
C.不一致的值
D.重复值
正确答案:————
10.[单选题]单层感知机拥有()层功能神经元。
A.一
B.二
C.三
D.四
正确答案:————
11.[单选题]下面不是分类的常用方法的有()
A.K近邻法
B.朴素贝叶斯
C.决策树
D.条件随机场
正确答案:————
12.[单选题]根据映射关系的不同可以分为线性回归和()。
A.对数回归
B.非线性回归
C.逻辑回归
D.多元回归
正确答案:————
13.[单选题]比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()
A.异常值
B.不一致的值
C.重复值
D.缺失值
正确答案:————
14.[单选题]聚类是一种()。
A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习
正确答案:————
15.[单选题]实体识别属于以下哪个过程()
A.数据清洗
B.数据集成
C.数据规约
D.数据变换
正确答案:————
16.[单选题]以下哪一项不属于数据变换()
A.简单函数变换
B.规范化
C.属性合并
D.连续属性离散化
正确答案:————
17.[单选题]K-means聚类适用的数据类型是()。
A.数值型数据
B.字符型数据
C.语音数据
D.所有数据
正确答案:————
18.[单选题]以下哪个不是处理缺失值的方法()
A.删除记录
B.按照一定原则补充
C.不处理
D.随意填写
正确答案:————
19.[单选题]在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。
A.最优回归线
B.最优分布线
C.最优预测线
D.最佳分布线
正确答案:————
20.[单选题]例如将工资收入属性值映射到[-1,1]或者内属于数据变换中的()
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化
正确答案:————
21.[多选题]对于多层感知机,()层拥有激活函数的功能神经元。
A.输入层
B.隐含层
C.输出层
正确答案:————
22.[多选题]一元回归参数估计的参数求解方法有()。
A.最大似然法
B.距估计法
C.最小二乘法
D.欧式距离法
正确答案:————
23.[多选题]下列选项是BFR的对象是()
A.废弃集
B.临时集
C.压缩集
D.留存集
正确答案:————
24.[多选题]多层感知机的学习过程包含()。
A.信号的正向传播
B.信号的反向传播
C.误差的正向传播
D.误差的反向传播
正确答案:————
25.[多选题]系统日志收集的基本特征有()
A.高可用性
B.高可靠性
C.可扩展性
D.高效率
正确答案:————
26.[多选题]什么情况下结点不用划分()
A.当前结点所包含的样本全属于同一类别
B.当前属性集为空,或是所有样本在所有属性上取值相同
C.当前结点包含的样本集为空
D.还有子集不能被基本正确分类
正确答案:————
27.[多选题]K-means聚类中K值选取的方法是()。
A.密度分类法
B.手肘法
C.大腿法
D.随机选取
正确答案:————
28.[多选题]层次聚类的方法是()
A.聚合方法
B.分拆方法
C.组合方法
D.比较方法
正确答案:————
29.[多选题]关联规则的评价度量主要有:()。
A.支持度
B.置信度
C.准确率
D.错误率
正确答案:————
30.[多选题]k近邻法的基本要素包括()。
A.距离度量
B.k值的选择
C.样本大小
D.分类决策规则
正确答案:————
31.[多选题]数据科学具有哪些性质()
A.有效性
B.可用性
C.未预料
D.可理解
正确答案:————
32.[多选题]相关性的分类,按照相关的方向可以分为()。
A.正相关
B.负相关
C.左相关
D.右相关
正确答案:————
33.[多选题]聚类的主要方法有()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类
正确答案:————
34.[多选题]Apriori算法的计算复杂度受()影响。
A.支持度阈值
B.项数
C.事务数
D.事务平均宽度
正确答案:————
35.[多选题]距离度量中的距离可以是()
A.欧式距离
B.曼哈顿距离
C.Lp距离
D.Minkowski距离
正确答案:————
36.[判断题]具有双隐层的感知机足以用于解决任何复杂的分类问题。
A.对
B.错
正确答案:————
37.[判断题]如果一个候选集至少有一个子集是非频繁的,根据支持度的反单调属性,这样的候选项集肯定是非频繁的。
A.对
B.错
正确答案:————
38.[判断题]两个对象越相似,他们的相异度就越高。
A.对
B.错
正确答案:————
39.[判断题]多层感知机的学习能力有限,只能处理线性可分的二分类问题。
A.对
B.错
正确答案:————
40.[判断题]给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。
A.对
B.错
正确答案:————
41.[判断题]决策树分类时将该结点的实例强行分到条件概率大的那一类去
A.对
B.错
正确答案:————
42.[判断题]相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。
A.对
B.错
正确答案:————
43.[判断题]标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。
A.对
B.错
正确答案:————
44.[判断题]利用K近邻法进行分类时,k值过小容易发生过拟合现象。
A.对
B.错
正确答案:————
45.[判断题]关联规则可以用枚举的方法产生。
A.对
B.错
正确答案:————
46.[判断题]数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选
A.对
B.错
正确答案:————
47.[判断题]增加神经元的个数,无法提高神经网络的训练精度。
A.对
B.错
正确答案:————
48.[判断题]uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同
A.对
B.错
正确答案:————
49.[判断题]数据科学可以回答复杂的问题,发现世界中隐藏的联系并预测和指导未来。
A.对
B.错
正确答案:————
50.[判断题]分拆方法是自底向上的方法。
A.对
B.错
正确答案:————
51.[判断题]支持度是衡量关联规则重要性的一个指标。
A.对
B.错
正确答案:————
52.[判断题]信息熵越小,样本结合的纯度越低
A.对
B.错
正确答案:————
53.[判断题]获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。
A.对
B.错
正确答案:————
54.[判断题]决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布
A.对
B.错
正确答案:————
55.[判断题]使用SVD方法进行图像压缩不可以保留图像的重要特征。
A.对
B.错
正确答案:————
56.[]<img src="http://file.open.com.cn/ueditorupload/image/2020/03/11/6371951590432642874205659.png" title="数据科学导论题目1.png" alt="数据科学导论题目1.png">
正确答案:————
57.[]决策树的基本组成由结点和有向边组成,其中结点分为哪两种类型和代表含义是什么?以及决策树的基本思想?
正确答案:————
58.[问答题]单层感知机和多层感知机分别解决的是哪类问题?
正确答案:————
59.[问答题]什么是神经网络?神经网络中最基本的成分是什么?
正确答案:————这套题目答案不含主观题
请核对题目下载Q Q 76 129 60 21
页:
[1]