最新消息:可做奥鹏等各院校作业论文,答案请联系QQ/微信:18866732

【奥鹏】22年春东财《数据挖掘概论》单元作业二

东财《数据挖掘概论》单元作业二

试卷总分:100  得分:100

一、单选题 (共 10 道试题,共 50 分)

1.可以用于阐明数据质量的要素中,不包括( )。

A.特殊性

B.准确性

C.完整性

D.一致性

 

2.以下选项中,属于监督的离散化技术的是( )。

A.直方图分析

B.分箱

C.决策树分析

D.K-means

 

3.规范化、数据离散化和概念分层产生都是某种形式的( )。

A.数据清理

B.数据集成

C.数据删除

D.数据变换

 

4.( )可以通过如聚集、删除冗余特征或聚类来降低数据的规模。

A.数据集成

B.数据归约

C.数据变换

D.数据清理

 

5.对于以下项集:{A,B};{A,C,D,E};{B,C,D,F};{A,B,C,D},{A,B,C,F}。其中,{A,B,C}的支持度为( )。

A.0

B.1/5

C.2/5

D.3/5

 

6.下面属于维归约常用的线性代数技术的是( )。

A.特征提取

B.主成分分析

C.特征加权

D.离散化

 

7.购物篮子分析是数据挖掘中( )任务的典型例子。

A.频繁项集挖掘

B.分类和预测

C.数据预处理

D.数据流挖掘

 

8.不包含任何频繁k项集的事务不可能包含任何频繁( )项集。

A.k

B.k-1

C.k+1

D.k-2

 

9.数据变换策略中,( )可以由给定属性构造新的属性并添加到属性集中,以帮助挖掘过程。

A.光滑

B.属性构造

C.聚集

D.规范化

 

10.( )将数据由多个数据源合并成一个一致的数据存储,如数据仓库。

A.数据集成

B.数据归约

C.数据变换

D.数据清理

 

二、多选题 (共 5 道试题,共 25 分)

11.以下属于频繁项集挖掘方法的有( )。

A.Apriori算法奥鹏作业答案请进open5.net或请联系QQ/微信:18866732

B.频繁模式增长

C.聚类

D.分类

 

12.关联规则的基本框架有( )。

A.支持度

B.提升度

C.置信度

D.卡方分析

 

13.以下属于挖掘频繁模式评估度量方法的有( )。

A.全置信度

B.最大置信度

C.Kulczynski

D.余弦

 

14.以下可能导致数据偏差的因素有( )。

A.过时的地址

B.故意错填个人信息

C.设计糟糕的输入表单

D.数据输入错误

 

15.维归约作为数据归约的主要策略,其具体技术包括( )。

A.参数方法

B.小波变换

C.主成分分析

D.属性子集选择

 

三、判断题 (共 5 道试题,共 25 分)

16.通过为找候选项集划分数据可以提高Apriori算法的效率。( )

 

17.频繁项集的所有非空子集也一定是频繁的。( )

 

18.聚类、决策树和相关分析可以用于数据离散化。( )

 

19.分箱使用类信息,因此是一种有监督的离散化技术。( )

 

20.提升度不受零事务数量影响。(

转载请注明:奥鹏作业之家 » 【奥鹏】22年春东财《数据挖掘概论》单元作业二

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址