东财《大数据——概念、方法与应用》单元作业2
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.( )是一些管理方面的最佳实践。
A.数据挖掘
B.可视化分析
C.数据质量和管理
D.预测性分析
2.K-Means算法不适合处理( )属性。
A.连续型
B.离散型
C.稳定型
D.随机型
3.在企业危机管理及其预警中,管理者更感兴趣的是( )。
A.关联规则
B.意外规则
C.依赖规则
D.相关规则
4.( )是数据分析工具最基本的要求。
A.数据挖掘
B.可视化分析
C.数据质量和管理
D.预测性分析
5.两个或多个变量的( )之间存在某种规律性,就称为关联。
A.范围
B.特点
C.取值
D.字段
6.回归分析发现变量或属性间的( )关系。
A.泛化
B.实现
C.局部
D.依赖
7.数据挖掘的分类方法是找出数据库中一组数据对象的( )并按照分类模式将其划分为不同的类。
A.共同点
B.不同点
C.属性
D.值
8.偏差检测的基本方法是寻找( )之间有意义的差别。
A.期望值与参照值
B.观测值与参照值
C.预测值与参照值
D.期望值与预测值
9.( )需要被设计成能够从“文档”中智能提取信息。
A.可视化分析
B.数据挖掘
C.预测性分析
D.语音引擎
10.半结构化的数据分析需求可以使用( )。
A.GreenPlum
B.Exadata
C.Infobright
D.Hadoop
二、多选题 (共 5 道试题,共 25 分)
11.从商业层面上看,数据挖掘的主要特点有( )。
A.对商业数据库中的大量业务数据进行抽取、转换
B.对商业数据库中的大量业务数据进行分析
C.对商业数据库中的大量业务数据进行其他模型化处理
D.从商业数据库中提取辅助商业决策的关键性数据
12.聚类技术主要包括( )。
A.传统的模式识别方法
B.数据分类法
C.特征分类法
D.属性分类法
13.统计与分析的主要特点和挑战有( )。
A.分析设计的数据量大
B.对系统资源有极大的占用
C.对I/O有极大的占用
D.分析的效率低
14.回归分析主要研究问题包括( )。
A.数据序列的趋势特征
B.数据序列的预测
C.数据序列的统计
D.数据间的相关关系
15.概念描述分析( )。
A.特征性描述
B.区别性描述
C.共同性描述
D.关联性描述
三、判断题 (共 5 道试题,共 25 分)
16.统计分析主要利用分布式数据库对存储于其内的海量数据进行分析和分类汇总。( )
17.电商会使用传统的关系型数据库存储每一笔事务数据。( )
18.对于大数据分析需求,一些实时性需求会用到EMC的GreenPlum。( )
19.分类的目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。( )
20.数据挖掘发现的是用户感兴趣的知识。( )
奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777