北语22年5月22春《大数据技术与应用》作业4题目
22春《大数据技术与应用》作业41.[多选题] 分箱法包括
答案资料下载请参考帮助中心说明
A.等深分箱
B.众数分箱
C.等宽分箱
D.以上都不对
答:——AC——
2.[判断题] 高层次数据无法向低层次转化,会出现F
A.对
B.错 南开大学答案无忧答案网整理
答:——B——
3.[单选题] from sklearn.neighbors import KNeighborsClassifiernknn = KNeighborsClassifier(n_neighbors=3) n上面代码中可以看出,KNN分类器的k值设置为
A.1
B.2
C.3
D.4
答:——C——
4.[单选题] 决策树生成过程的停止条件
A.当前结点包含的样本全属于同一类别,无需划分
B.当前属性集为空,或是所有样本在所有属性上取值相同,无法划分
C.当前结点包含的样本集合为空,不能划分
D.以上都不对
答:————
5.[多选题] 数据挖掘(Data Mining)则是知识发现(KDD)的核心部分,它指的是从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为
A.规则
B.概念
C.规律
D.模式
答:————
6.[单选题] 以下不是数据可视化工具库的是()
A.pandas
B.matplotlib
C.matlab
D.seaborn
答:————
7.[单选题] 决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A.ID3
B.C4.5
C.CART
D.以上都不对
答:————
8.[单选题] 逻辑回归中的“逻辑”是指
A.规则
B.Sigmoid函数
C.学者名字
D.以上都不对
答:————
9.[单选题] 处理缺失值的方法有删除和()
A.替换
B.复制
C.修改
D.屏蔽
答:————
10.[单选题] 数据集{1,2,2,2,3,4}的众数是
A.1
B.2
C.3
D.4
答:————
11.[单选题] 利用pandas处理数据缺失值时,用于发现缺失值的函数为
A.isnull
B.head
C.tail
D.info
答:————
12.[多选题] 定性数据包括
A.有序数据
B.无序数据
C.定类等级数据
D.定性等级数据
答:————
13.[单选题] 用训练好的随机森林对样本进行类别预测的语句是
A.from sklearn.tree import DecisionTreetClassifier
B.clf=DecisionTreetClassifier()
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
答:————
14.[判断题] 众数在一组数据中只有一个
A.对
B.错
答:————
15.[单选题] 利用pandas处理数据缺失值时,用于填充缺失值的函数为
A.isnull
B.head
C.fillna
D.dropna
答:————
16.[多选题] 异常检测的难点
A.不能明确定义何为正常,何为异常,在某些领域正常和异常并没有明确的界限
B.数据本身存在噪声,致使噪声和异常难以区分
C.正常行为并不是一成不变,也会随着时间演化,如正常用户被盗号之后,进行一系列的非法操作
D.难以获取标记数据,没有数据,再好的算法也是无用
答:————
核对题目下载 转载注明无忧答案网
页:
[1]