23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00003
试卷总分:100 得分:100
一、单选题 (共 50 道试题,共 100 分)
1.pthread_sem_wait是对信号量进行____操作。
A.加锁
B.解锁
C.加1
D.减1
2.一个SSE寄存器可容纳____个短整型数。
A.2
B.4
C.8
D.16
3.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
A.已有一个线程上了读锁
B.已有一个线程上了写锁
C.已有多个线程上了读锁
D.已有多个线程上了写锁
4.对单精度浮点计算,AVX最高实现____路并行。
A.2
B.4
C.8
D.16
5.在条件不成立时,使用pthread_cond_wait____。
A.令线程阻塞
B.解锁互斥量
C.解锁互斥量然后令线程阻塞
D.加锁互斥量
6.推动GPU应用于通用高性能计算爆发式增长的开发工具是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
7.pthread_join的第二个参数的作用是____。
A.设置指定线程属性
B.获取指定线程属性
C.向指定线程传递参数
D.获取指定线程函数返回结果
8.MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
9.我们不能通过____指定OpenMP循环划分策略。
A.使用编译指示
B.设置环境变量
C.调用库函数
D.采用默认设置
10.CUDA生态环境的特点不包括____。
A.支持多种显卡架构
B.支持CPU、GPU自动混合并行
C.支持多种编程语言
D.支持多领域的库
11.华尔街是世界上超级计算机最密集的区域之一,原因是____。
A.金融巨头支付得起
B.与超算制造商有良好合作
C.海量交易需要很高安全性
D.海量交易处理需要并行计算
12.对下面程序,说法正确的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.破坏了数据依赖
B.未破坏数据依赖
C.取决于变量声明
D.比临界区方式性能差
13.使用____无法直接实现“主线程等待4个从线程完成任务”。
A.1个信号量
B.障碍
C.1个互斥量
D.4个互斥量
14.神威.太湖之光采用的申威26010处理器是一种____架构。
A.单核
B.多核
C.众核
D.多CPU
15.SIMD并行模式是将多个____运算打包并发执行。
A.不同
B.相同
C.混合
D.依赖
16.超级计算机制造越来越关注的一个新的指标是____。
A.计算能力
B.存储能力
C.占地面积
D.功耗
17.为了实现向量计算,SIMD架构还需提供____。
A.更大的内存容量
B.更快的内存传输
C.更宽的寄存器
D.更快的网络传输
18.超立方中相邻节点二进制编号____。
A.至少差1位
B.至多差1位
C.恰好差1位
D.差异不固定
19.pthread_join通过____指定要等待的线程。
A.pthread_create返回的线程句柄
B.线程的系统ID
C.创建线程时设置的线程号
D.创建线程时设置的线程名
20.每个MMX寄存器宽度为____位。
A.32
B.64
C.128
D.256
21.一个Neon寄存器最多存放____个短整型数。
A.2
B.4
C.8
D.16
22.对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A.声明语句
B.条件分支语句
C.循环语句
D.输入输出语句
23.n*n的两个矩阵相乘,问题规模为____。
A.n
B.n^2
C.2n^2
D.n^3
24.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
A.初始化
B.第二个矩阵转置循环
C.矩阵元素乘—加计算的循环
D.结果输出
25.关于MPI是什么,以下说法错误的是____。
A.一种消息传递编程模型标准
B.一种共享内存编程模型标准
C.编程角度看是C++/Fortran等的库
D.基于SPMD模型
26.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
27.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A.按编号顺序依次从从进程接收结果
B.按编号逆序依次从从进程接收结果
C.按编号顺序、逆序交替从从进程接收结果
D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
28.以下____是MPI基本原语。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
29.对于效率E,下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能>1
D.可能随着处理器数量增大趋向于0
30.n个节点的二维mesh构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
31.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
32.对于加速比S和处理器数量p,下列说法正确的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.两者无关联
33.“提升时钟频率”方式提高CPU性能的限制因素不包括____。
A.物理制造局限
B.功耗问题
C.散热问题
D.软件设计问题
34.OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
35.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
A.单核CPU
B.多核CPU
C.FPGA
D.众核协处理器
36.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法
B.寄存器间双精度浮点数向量加法
C.寄存器内单精度浮点数加法
D.寄存器内双精度浮点数加法
37.OpenMP不能实现的是____。
A.负责创建和管理线程
B.隐藏栈管理
C.提供同步机制
D.自动并行化
38.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
A.时间局部性
B.空间局部性
C.计算局部性
D.混合局部性
39.SSE运算指令中未提供____指令。
A.算术运算
B.矩阵运算
C.逻辑运算
D.比较运算
40.C/C++语言存储二维数组采取____。
A.行主次序存储
B.列主次序存储
C.交错式存储
D.对角线存储
41.SSE intrinsics _mm_store_ss命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存双精度浮点数
C.对齐标量存单精度浮点数
D.未对齐标量存双精度浮点数
42.n个节点的线性阵列构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
43.定期评选全球计算能力最强的超级计算机的国际组织是____。
A.top500
B.green500
C.graph500
D.super500
44.对于搜索分解,下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
45.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
46.主线程通过____函数获取特定线程的返回结果。
A.pthread_create
B.pthread_join
C.pthread_cancel
D.pthread_get
47.静态任务划分相对于动态任务划分的缺点是____。
A.可能导致负载不均
B.通信开销高
C.计算复复杂度高
D.任务粒度粗
48.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
A.读取x存在数据依赖,不能并发进行
B.累加顺序被改变,结果是错误的
C.加法操作是简单运算,无需同步
D.加法操作不是原子操作,需要同步保证数据依赖
49.GPU相对于其他众核产品的优势不包括____。
A.平台普及
B.有CUDA这样易学的开发工具
C.性价比高
D.由英伟达公司一家把控
50.SSE数据移动指令分类不包括____。
A.对齐传输
B.未对齐传输
C.标量传输
D.缓存传输
奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777