南开21春学期《数据科学导论》在线作业（标准答案）-奥鹏学无忧教育辅导

可做奥鹏院校所有作业，毕业论文，咨询请添加QQ：3230981406 微信：aopopenfd777

21春学期（1709、1803、1809、1903、1909、2003、2009、2103）《数据科学导论》在线作业
试卷总分:100 得分:100
第1题,单层感知机是由()层神经元组成。
A、一
B、二
C、三
D、四
正确答案:

第2题,K-means聚类适用的数据类型是()。
A、数值型数据
B、字符型数据
C、语音数据
D、所有数据
正确答案:

第3题,在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。
A、最优回归线
B、最优分布线
C、最优预测线
D、最佳分布线
正确答案:

第4题,例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案:

答案来源：（www.）,在k近邻法中,选择较小的k值时,学习的"近似误差"会(),"估计误差"会()。
A、减小，减小
B、减小，增大
C、增大，减小
D、增大，增大
正确答案:

第6题,聚类的最简单最基本方法是()。
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案:

第7题,设X={1,2,3}是频繁项集,则可由X产生()个关联规则。
A、4
B、5
C、6
D、7
正确答案:

第8题,在回归分析中,自变量为(),因变量为()。
A、离散型变量，离散型变量
B、连续型变量，离散型变量
C、离散型变量，连续型变量
D、连续型变量，连续型变量
正确答案:

第9题,哪一项不属于规范化的方法()
A、最小-最大规范化
B、零-均值规范化
C、小数定标规范化
D、中位数规范化
正确答案:

答案来源：（www.）,单层感知机模型属于()模型。
A、二分类的线性分类模型
B、二分类的非线性分类模型
C、多分类的线性分类模型
D、多分类的非线性分类模型
正确答案:

第11题,以下哪个不是处理缺失值的方法()
A、删除记录
B、按照一定原则补充
C、不处理
D、随意填写
正确答案:

答案来源：（www.）,我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A、自上而下
B、自下而上
C、自左而右
D、自右而左
正确答案:

第13题,下列两个变量之间的关系中,哪个是函数关系()。
A、人的性别和他的身高
B、人的工资与年龄
C、正方形的面积和边长
D、温度与湿度
正确答案:

第14题,变量之间的关系一般可以分为确定性关系与()。
A、非确定性关系
B、线性关系
C、函数关系
D、相关关系
正确答案:

答案来源：（www.）,单层感知机拥有()层功能神经元。
A、一
B、二
C、三
D、四
正确答案:

第16题,通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A、简单函数变换
B、规范化
C、属性构造
D、连续属性离散化
正确答案:

第17题,在一元线性回归模型中,残差项服从()分布。
A、泊松
B、正态
C、线性
D、非线性
正确答案:

第18题,层次聚类对给定的数据进行()的分解。
A、聚合
B、层次
C、分拆
D、复制
正确答案:

第19题,以下哪一项不是特征选择常见的方法()
A、过滤式
B、封装式
C、嵌入式
D、开放式
正确答案:

答案来源：（www.）,对于k近邻法,下列说法错误的是()。
A、不具有显式的学习过程
B、适用于多分类任务
C、k值越大，分类效果越好
D、通常采用多数表决的分类决策规则
正确答案:

第21题,聚类的主要方法有()。
A、划分聚类
B、层次聚类
C、密度聚类
D、距离聚类
正确答案:,B,C

第22题,数据科学具有哪些性质()
A、有效性
B、可用性
C、未预料
D、可理解
正确答案:,B,C,D

第23题,下面例子属于分类的是()
A、检测图像中是否有人脸出现
B、对客户按照贷款风险大小进行分类
C、识别手写的数字
D、估计商场客流量
正确答案:,B,C

第24题,下列选项是BFR的对象是()
A、废弃集
B、临时集
C、压缩集
D、留存集
正确答案:,C,D

答案来源：（www.）,Apriori算法的计算复杂度受()影响。
A、支持度阈值
B、项数
C、事务数
D、事务平均宽度
正确答案:,B,C,D

第26题,相关性的分类,按照相关的方向可以分为()。
A、正相关
B、负相关
C、左相关
D、右相关
正确答案:,B

第27题,系统日志收集的基本特征有()
A、高可用性
B、高可靠性
C、可扩展性
D、高效率
正确答案:,B,C

第28题,什么情况下结点不用划分()
A、当前结点所包含的样本全属于同一类别
B、当前属性集为空，或是所有样本在所有属性上取值相同
C、当前结点包含的样本集为空
D、还有子集不能被基本正确分类
正确答案:,B,C

第29题,k近邻法的基本要素包括()。
A、距离度量
B、k值的选择
C、样本大小
D、分类决策规则
正确答案:,B,D

答案来源：（www.）,距离度量中的距离可以是()
A、欧式距离
B、曼哈顿距离
C、Lp距离
D、Minkowski距离
正确答案:,B,C,D

第31题,K-means算法采用贪心策略,通过迭代优化来近似求解。
T、对
F、错
更多答案下载：（www.）

第32题,随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。
T、对
F、错
更多答案下载：（www.）

第33题,一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的"纯度提升越大",因此我们可用信息增益来进行决策树的最优特征选择。
T、对
F、错
更多答案下载：（www.）

第34题,关联规则可以用枚举的方法产生。
T、对
F、错
更多答案下载：（www.）

第35题,Jaccard系数只关心个体间共同具有的特征是否一致这个问题。
T、对
F、错
更多答案下载：（www.）

第36题,特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。
T、对
F、错
更多答案下载：（www.）

第37题,由不同的距离度量所确定的最近邻点是不同的
T、对
F、错
更多答案下载：（www.）

第38题,Apriori算法是一种典型的关联规则挖掘算法。
T、对
F、错
更多答案下载：（www.）

第39题,决策树的输入为训练集,输出为以node为根结点的一棵决策树
T、对
F、错
更多答案下载：（www.）

第40题,K均值(K-Means)算法是密度聚类。
T、对
F、错
正确答案:F

第41题,如果一个候选集至少有一个子集是非频繁的,根据支持度的反单调属性,这样的候选项集肯定是非频繁的。
T、对
F、错
更多答案下载：（www.）

第42题,啤酒与尿布的故事是聚类分析的典型实例。
T、对
F、错
正确答案:F

第43题,对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。
T、对
F、错
更多答案下载：（www.）

第44题,标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。
T、对
F、错
正确答案:F

第45题,特征的信息增益越大,则其越不重要。
T、对
F、错
正确答案:F

第46题,为了尽可能正确分类训练样本,结点划分过程将不断重复,有时会造成决策树分支过少,以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合
T、对
F、错
正确答案:F

第47题,不满足给定评价度量的关联规则是无趣的。
T、对
F、错
正确答案:F

第48题,具有双隐层的感知机足以用于解决任何复杂的分类问题。
T、对
F、错
更多答案下载：（www.）

第49题,多层感知机的学习能力有限,只能处理线性可分的二分类问题。
T、对
F、错
正确答案:F

答案来源：（www.）,uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同
T、对
F、错
正确答案:

微信客服扫一扫