最新消息:可做奥鹏等各院校作业论文,答案请联系QQ/微信:18866732

【奥鹏】22年春东财《数据挖掘概论》单元作业三

东财《数据挖掘概论》单元作业三

试卷总分:100  得分:100

一、单选题 (共 10 道试题,共 50 分)

1.线性回归通常通过( )方法进行参数估计。

A.最小二乘法

B.牛顿法

C.聚类

D.拉格朗日法

 

2.关于混合模型聚类算法的优缺点,下面说法正确的是( )。

A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理

B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布

C.混合模型很难发现不同大小和椭球形状的簇

D.混合模型在有噪声和离群点时不会存在问题

 

2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。

A.层次聚类

B.划分聚类

C.非互斥聚类

D.模糊聚类

 

4.决策树中不包含( )。

A.根结点(rootnode)

B.内部结点(internalnode)

C.外部结点(externalnode)

D.叶结点(leafnode)

 

5.( )是利用一个分类函数(分类模型、分类器),该模型能把数据库中的数据影射到给定类别中的一个。

A.聚类

B.分类

C.相关分析

D.数据预处理

 

6.BIRCH是一种( )。

A.分类器

B.聚类算法

C.关联分析算法

D.特征选择算法

 

7.( )是基于类比学习,即通过将给定的检验元组与和它相似的训练元组进行比较来学习。

A.最近邻分类法

B.贝叶斯信念网络

C.向后传播分类

D.支持向量机

 

8.基于代表对象的聚类技术是( )。

A.k-均值

B.k-中心点

C.AGNES

D.DIANA

 

9.树状图一般用来描述( )聚类的过程。

A.划分

B.密度

C.层次

D.网格

 

10.以下( )分类方法可以较好地避免样本的不平衡问题。

A.神经网络

B.SVM

C.KNN

D.Bayes

 

二、多选题 (共 5 道试题,共 25 分)

11.逻辑回归方法可以用于( )。

A.GDP预测

B.情感分类

C.疾病分类

D.垃圾邮件分类

 

12.计算R2需要用到( )。

A.离差平方和

B.回归平方和

C.残差平方和

D.偏最小二乘法奥鹏作业答案请进open5.net或请联系QQ/微信:18866732

13.以下关于决策树说法正确的有( )。

A.ID3、C4.5和CART都采用贪心(即非回溯的)方法

B.决策树以自顶向下递归的分治方式构造

C.随着树的构建,训练集递归地划分成较小的子集

D.决策树必须严格遵循二叉树进行分叉

 

14.聚类分析的应用包括( )。

A.商务智能

B.图像模式识别

C.Web搜索

D.生物学

 

15.属于分类的方法有( )。

A.决策树

B.K近邻

C.朴素贝叶斯

D.逻辑回归

 

三、判断题 (共 5 道试题,共 25 分)

17.精准率是分类器正确分类的检验元组所占的百分比。( )

 

17.多重共线性不会影响线性回归模型参数估计的结果。( )

 

18.在决策树中,每个内部节点表示一个测试的输出。( )

 

19.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。( )

 

20.轮廓系数的数值越小说明模型的聚类效果越好。( )

转载请注明:奥鹏作业之家 » 【奥鹏】22年春东财《数据挖掘概论》单元作业三

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址