可做奥鹏院校所有作业,毕业论文,咨询请添加QQ:3230981406 微信:aopopenfd777
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业
试卷总分:100 得分:100
第1题,数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:
第2题,第一个提出大数据概念的公司是( )。
A、麦肯锡公司
B、谷歌公司
C、微软公司
D、脸谱公司
正确答案:
第3题,以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案:
第4题,基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案:
答案来源:(www.),大数据的特点不包含
A、数据体量大
B、价值密度高
C、处理速度快
D、数据不统一
正确答案:
第6题,SAN是一种()
A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA
正确答案:
第7题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:
第8题,医疗健康数据的基本情况不包括以下哪项?
A、诊疗数据
B、个人健康管理数据
C、公共安全数据
D、健康档案数据
正确答案:
第9题,()是Microsoft Office的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案:
答案来源:(www.),哪个选项不属于大数据4V特点?
A、Volume
B、Valid
C、Variety
D、Value
正确答案:
第11题,以下哪项不是数据可视化工具的特性()
A、实时性
B、简单操作
C、更丰富的展现
D、仅需一种数据支持方式即可
正确答案:
答案来源:(www.),大数据的最显著特征是() 。
A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
正确答案:
第13题,MapReduce中的Map和Reduce函数使用()进行输入输出
A、key/value对
B、随机数值
C、其他计算结果
正确答案:
第14题,数据仓库是随着时间变化的,下列不正确的是()
A、数据仓库随时间变化不断增加新内容
B、捕捉到的新数据会覆盖原来的快照
C、数据仓库随事件变化不断删去旧的数据内容
D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:
答案来源:(www.),GFS中的文件切分成()的块进行存储
A、32MB
B、64MB
C、128MB
D、1G
正确答案:
第16题,开放云()
A、价值呈现:大数据应用价值呈现和创新不足
B、应用建设:周期长、门槛高、多冗余、体验差
C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产
D、生态建设:无法有效构建和融入新的数字生态圈
正确答案:,B,C,D
第17题,##和##,它们把原数据变换或投影到较小的空间。
A、小波变换
B、中心化变换
C、主成分分析
D、对数变换
正确答案:,C
第18题,下列属于传统统计学展示方法的是()
A、柱状图
B、饼状图
C、曲线图
D、网络图
正确答案:,B,C
第19题,数据工厂包括
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维
D、超强云安全
正确答案:,B,C,D
答案来源:(www.),数据变换的常用方法有##,##,##,##
A、中心化变换
B、极差规格化变换
C、标准化变换
D、对数变换
正确答案:,B,C,D
第21题,大数据在医疗中的应用有()
A、流行性疾病预防
B、慢性病健康管理
C、临床决策支持
D、医疗器械研发
正确答案:,B,C,D
第22题,可视化工具包括()
A、Excel
B、Google Chart
C、Gephi
D、ppt
正确答案:,B,C
第23题,大数据时代预测人类移动行为的数据来源有
A、志愿者定位数据
B、装有导航设备的出租车轨迹数据
C、手机终端定位于通讯记录
D、社会网络签到数据
正确答案:,B,C,D
第24题,大数据带来的挑战有哪些( )。
A、会导致数据盲点
B、危及个人隐私
C、造成群体歧视
D、产生庞大能耗
正确答案:
答案来源:(www.),传感器工作模式类别包括()
A、基于位置
B、基于活动
C、基于设备
正确答案:,B,C
第26题,去除噪声使得数据光滑的技术主要有:
A、分箱
B、回归
C、离群点分析
正确答案:,B,C
第27题,可使用##,##,##进行光滑。
A、最大值
B、箱中位数
C、箱边界
D、箱均值
正确答案:,C,D
第28题,最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A、用户行为数据
B、日志式的活动数据
C、事件信息
正确答案:,B,C
第29题,大数据存储的特点与挑战有()
A、容量问题
B、延迟问题
C、安全问题
D、成本问题
正确答案:,B,C,D
答案来源:(www.),统计图表的可视化方法主要包括()
A、散点图
B、折线图
C、条形图
D、饼图
正确答案:
第31题,Spark的亮点是充分利用内存承载工作集,而且能保证容错。
T、对
F、错
更多答案下载:(www.)
第32题,知识图谱的构建属于大数据在社交网络中的应用
T、对
F、错
正确答案:
第33题,道路速度视图显示每条道路的速度模式
T、对
F、错
正确答案:
第34题,越来越多的企业通过架设海量数据采集系统,多用于系统日志采集,这些工具均采用分布式架构,能满足每秒数百兆的日志数据采集和传输需求。
T、对
F、错
正确答案:
第35题,Apriori算法扫描数据库的次数等于最大频繁项集的项数。
T、对
F、错
更多答案下载:(www.)
第36题,数据仓库中的元数据分为技术元数据和业务元数据
T、对
F、错
正确答案:
第37题,大数据数据量一定是PB,TB级的
T、对
F、错
正确答案:F
第38题,21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
T、对
F、错
更多答案下载:(www.)
第39题,数据获取方式分为主动式获取和被动式获取
T、对
F、错
更多答案下载:(www.)
第40题,数据存取和共享机制是大数据发展面临的挑战
T、对
F、错
更多答案下载:(www.)
第41题,发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
T、对
F、错
更多答案下载:(www.)
第42题,利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。
T、对
F、错
更多答案下载:(www.)
第43题,数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。
T、对
F、错
更多答案下载:(www.)
第44题,分类是在给定数据基础上构建分类函数或分类模型,将数据划分到预定义的目标类中的某一种类别。
T、对
F、错
更多答案下载:(www.)
第45题,大数据的挑战仅仅来自于数据的增长。
T、对
F、错
正确答案:F
第46题,Excel采用插件的形式来实现数据挖掘功能,其数据挖掘插件主要包括Excel表分析工具和Excel数据挖掘客户端
T、对
F、错
正确答案:
第47题,不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
T、对
F、错
更多答案下载:(www.)
第48题,Paas:软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
T、对
F、错
正确答案:F
第49题,IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
T、对
F、错
正确答案:F
答案来源:(www.),非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值
T、对
F、错
更多答案下载:(www.)