最新消息:可做奥鹏等各院校作业论文,答案请联系QQ/微信:18866732

【奥鹏】21秋东财《数据挖掘概论》单元作业二

东财《数据挖掘概论》单元作业二

试卷总分:100  得分:100

一、单选题 (共 10 道试题,共 50 分)

1.以下选项中,属于监督的离散化技术的是( )。

A.直方图分析

B.分箱

C.决策树分析

D.K-means

 

2.规范化、数据离散化和概念分层产生都是某种形式的( )。

A.数据清理

B.数据集成

C.数据删除

D.数据变换

 

3.( )可以通过如聚集、删除冗余特征或聚类来降低数据的规模。

A.数据集成

B.数据归约

C.数据变换

D.数据清理

 

4.提升度的值小于1,表明两个项之间的相关关系为( )。

A.正相关

B.置信度

C.不相关

D.不确定

 

5.下面购物篮能够提取的3-项集的最大数量是( )ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干。

A.1

B.2

C.3

D.4

 

6.Kulc度量的值越( ),A和B的联系越紧密。

A.大

B.小

C.不变

D.零

 

7.Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索( )项集。

A.k

B.k+1

C.k+2

D.k-1

 

8.设X={1,2,3,4}是频繁项集,则可由X产生( )个关联规则。

A.12

B.13

C.14

D.16

 

9.如果使用神经网络后向传播算法进行分类挖掘,对训练元组中每个属性的输入值进行( ),将有助于加快学习阶段的速度。

A.光滑

B.属性构造

C.聚集

D.规范化

 

10.数据变换策略中,把属性数据按比例缩放,使之落入一个特定的小区间的策略称为( )。

A.光滑

B.属性构造

C.聚集

D.规范化

 

二、多选题 (共 5 道试题,共 25 分)

11.以下属于频繁项集挖掘方法的有( )。

A.Apriori算法

B.频繁模式增长

C.聚类

D.分类

 

12.在以下的模式评估度量中属于零不变度量的有( )。

A.提升度

B.全置信度

C.最大置信度

D.余弦

 

13.关联规则的基本框架有( )。

A.支持度

B.提升度

C.置信度

D.卡方分析

 

14.PCA可以用于有序和无序的属性,并且可以更好地处理( )数据。

A.密集

B.高维

C.倾斜

D.稀疏

 

15.数据清理通过( )来“清理”数据。奥鹏作业答案请进open5.net或请联系QQ/微信:18866732

A.识别或删除离群点

B.光滑噪声数据

C.忽略缺失的值

D.解决不一致性来

 

三、判断题 (共 5 道试题,共 25 分)

16.通过为找候选项集划分数据可以提高Apriori算法的效率。( )

 

17.离散化不能用来处理噪声。( )

 

18.维归约和数量归约也可以看作是某种形式的数据压缩。( )

 

19.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。( )

 

20.提升度不受零事务数量影响。( )

 

转载请注明:奥鹏作业之家 » 【奥鹏】21秋东财《数据挖掘概论》单元作业二

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址