22春学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00001
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 30 分)
1.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
2.下列不属于商业大数据类型的是
A.传统企业数据
B.机器和传感器数据
C.社交数据
D.电子商务数据
3.下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源
B.大数据技术创新取得明显突破
C.大数据应用推动势头良好
D.大数据产业支撑薄弱
4.()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
D.EXCEL
5.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
6.第一个提出大数据概念的公司是( )。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
7.购物篮问题是##的典型案例
A.数据变换
B.关联规则挖掘
C.数据分类
8.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
9.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
10.MapReduce中的Map和Reduce函数使用()进行输入输出
A.key/value对
B.随机数值
C.其他计算结果
11.哪个选项不属于大数据4V特点?
A.Volume
B.Valid
C.Variety
D.Value
12.用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
13.下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
15.以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
二、多选题 (共 15 道试题,共 30 分)
16.可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
17.可使用##,##,##进行光滑。
A.最大值
B.箱中位数
C.箱边界
D.箱均值
18.以下可以用于数据可视化的是()。
A.R语言
B.Excel
C.RapidMiner
D.Weka
19.关于R语言扩展包下列正确的是()
A.network可创建带有点和边的网络图
B.animation可制作一系列的图像并将它们串联起来做成动画
C.ggmaps通过树图来可视化层次型数据
D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
20.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A.消费能力
B.趋势报告
C.购物结果
21.下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
22.主流分布式计算平台有()
A.google
B.IBM
C.baidu
D.Amazon
23.大数据在医疗中的应用有()
A.流行性疾病预防
B.慢性病健康管理
C.临床决策支持
D.医疗器械研发
24.基于大数据的临床决策支持系统的架构包括
A.支撑层
B.大数据分析层
C.网络层
D.应用层
25.数据分析的类型根据数据分析深度可以分为()
A.描述性分析
B.预测性分析s
C.规则性分析
26.大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
27.百度大数据引擎主要包含三大组件()
A.开放云
B.数据工厂
C.百度大脑。
28.统计图表的可视化方法主要包括()
A.散点图
B.折线图
C.条形图
D.饼图
29.云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.流计算
B.分布式计算
C.并行计算
D.网络计算
30.大数据在教育中的应用
A.网上公开课
B.慕课
C.智慧校园
D.翻转课堂
三、判断题 (共 20 道试题,共 40 分)
31.数据的集中存储增加了数据泄露风险。
32.发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
33.数据存在形式包括结构化数据和结构化数据
34.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。
35.基于腾讯大社交平台独特基因,以海量用户为基础,以大数据洞察为核心,以智能定向推广为导向,广点通提供一站式网络推广营销平台。
36.原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。
37.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据
38.广播变量在广播后可以修改
39.预测性分析(Predictive Analysis)用于预测未来事件发生的概率和演化趋势
40.数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
41.用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
42.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。
43.按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。
44.Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的“数据乐园”。人们越来愈倾向于在Facebook上表达自己的情绪。
45.美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”
46.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
47.树状图(Tree)通常用于表示层级、上下级、包含与被包含关系。
48.大数据从概念化走向价值化是大数据的发展趋势
49.时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示
50.大数据数据量一定是PB,TB级的
奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777