东财《数据分析与决策》单元作业一
试卷总分:100 得分:100
一、单选题 (共 5 道试题,共 25 分)
1.( )是后续的数据转化、模型计算的必要前提。
A.变量大小
B.变量转换
C.变量类别
D.变量类型
2.根据数据分析的目的,需要确定每一行都是( )的实体。
A.异质
B.同质
C.随意
D.有结构
3.下列关于回归分析说法不正确的是( )。
A.回归分析试图找出变量间确定的函数关系
B.回归分析是用函数关系描述变量间关系的
C.相关关系和回归分析不可以相互转化
D.回归分析在数据挖掘中被广泛应用,可作为预测的方法
4.在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。
A.正态分布
B.卡方分布
C.t分布
D.F分布
5.业务分析应该为明确的( )服务。
A.企业目标
B.计划
C.组织目标
D.战略目标
二、多选题 (共 5 道试题,共 25 分)
6.下列关于决策表的说法错误的有( )。
A.决策表是指尝试从模型训练中发现一些规则
B.决策树和决策表是完全不相同的,也完全不相似
C.决策表的规则和记录是一一对应的
D.决策表按照规则的顺序来决定规则的优先级
7.贝叶斯网络的价值主要有( )。
A.分类
B.预测
C.帮助了解因果关系
D.有效避免数据过度拟合
8.下列关于差异的说法正确的有( )。
A.偶然因素引起的差异往往是比较显著的
B.差异的绝对值大于给定的标准的概率分布区间称为拒绝区间
C.事件属于接受区间则判断总体无显著差异
D.事件属于拒绝区间,则认为总体有显著差异
9.下列关于支持向量机的理论正确的是( )。
A.支持向量机的理论基础就是统计学习理论。
B.根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成
C.支持向量机在解决大样本、非线性机高维模式识别问题中表现出许多特有的优势
D.线性分类器是支持向量机的基础
10.数据挖掘是从大量数据中寻找其规律的技术,是( )的综合。
A.统计学
B.计算机网络技术
C.数据库技术
D.人工智能技术
三、判断题 (共 10 道试题,共 50 分)
11.最近相邻算法中的邻居的远近是按照距离函数计算的。( )
12.一般来讲,训练集要包含所有可能的分类,这些分类的数目没有任何要求。( )
13.一般来说,如果样本容量越大,估计量会更接近总体参数。( )
14.业务分析主要特征是利用各种统计分析、优化等工具实现决策职能化。( )
15.数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构。( )
16.在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )
17.数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
18.数据可视化技术可以将所有数据的特性通过表的方式展示出来。( )
19.方差分析主要探讨给定量的变量与给定因素之间的关系。( )
20.截尾均值的好处就是能减少极端值的影响,较平均值更能反映实际情况。( )