南开23春学期《并行程序设计》在线作业【答案】

可做奥鹏全部院校在线离线作业毕业论文QQ:3230981406 微信:aopopenfd777

发布时间:2023-07-23 01:25:30来源:admin浏览: 0 次

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00003

试卷总分:100  得分:100

一、单选题 (共 50 道试题,共 100 分)

1.pthread_sem_wait是对信号量进行____操作。

A.加锁

B.解锁

C.加1

D.减1


2.一个SSE寄存器可容纳____个短整型数。

A.2

B.4

C.8

D.16


3.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。

A.已有一个线程上了读锁

B.已有一个线程上了写锁

C.已有多个线程上了读锁

D.已有多个线程上了写锁


4.对单精度浮点计算,AVX最高实现____路并行。

A.2

B.4

C.8

D.16


5.在条件不成立时,使用pthread_cond_wait____。

A.令线程阻塞

B.解锁互斥量

C.解锁互斥量然后令线程阻塞

D.加锁互斥量


6.推动GPU应用于通用高性能计算爆发式增长的开发工具是____。

A.OpenGL

B.OpenCL

C.DirectX

D.CUDA


7.pthread_join的第二个参数的作用是____。

A.设置指定线程属性

B.获取指定线程属性

C.向指定线程传递参数

D.获取指定线程函数返回结果


8.MPI基本原语不包括____。

A.MPI_Barrier

B.MPI_Comm_rank

C.MPI_Comm_size

D.MPI_Init


9.我们不能通过____指定OpenMP循环划分策略。

A.使用编译指示

B.设置环境变量

C.调用库函数

D.采用默认设置


10.CUDA生态环境的特点不包括____。

A.支持多种显卡架构

B.支持CPU、GPU自动混合并行

C.支持多种编程语言

D.支持多领域的库


11.华尔街是世界上超级计算机最密集的区域之一,原因是____。

A.金融巨头支付得起

B.与超算制造商有良好合作

C.海量交易需要很高安全性

D.海量交易处理需要并行计算


12.对下面程序,说法正确的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }

A.破坏了数据依赖

B.未破坏数据依赖

C.取决于变量声明

D.比临界区方式性能差


13.使用____无法直接实现“主线程等待4个从线程完成任务”。

A.1个信号量

B.障碍

C.1个互斥量

D.4个互斥量


14.神威.太湖之光采用的申威26010处理器是一种____架构。

A.单核

B.多核

C.众核

D.多CPU


15.SIMD并行模式是将多个____运算打包并发执行。

A.不同

B.相同

C.混合

D.依赖


16.超级计算机制造越来越关注的一个新的指标是____。

A.计算能力

B.存储能力

C.占地面积

D.功耗


17.为了实现向量计算,SIMD架构还需提供____。

A.更大的内存容量

B.更快的内存传输

C.更宽的寄存器

D.更快的网络传输


18.超立方中相邻节点二进制编号____。

A.至少差1位

B.至多差1位

C.恰好差1位

D.差异不固定


19.pthread_join通过____指定要等待的线程。

A.pthread_create返回的线程句柄

B.线程的系统ID

C.创建线程时设置的线程号

D.创建线程时设置的线程名


20.每个MMX寄存器宽度为____位。

A.32

B.64

C.128

D.256


21.一个Neon寄存器最多存放____个短整型数。

A.2

B.4

C.8

D.16


22.对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

A.声明语句

B.条件分支语句

C.循环语句

D.输入输出语句


23.n*n的两个矩阵相乘,问题规模为____。

A.n

B.n^2

C.2n^2

D.n^3


24.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。

A.初始化

B.第二个矩阵转置循环

C.矩阵元素乘—加计算的循环

D.结果输出


25.关于MPI是什么,以下说法错误的是____。

A.一种消息传递编程模型标准

B.一种共享内存编程模型标准

C.编程角度看是C++/Fortran等的库

D.基于SPMD模型


26.当处理器数量不变时,随着问题规模增大,效率增大对____成立。

A.部分并行算法

B.所有并行算法

C.所有并行算法都不

D.以上皆错


27.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。

A.按编号顺序依次从从进程接收结果

B.按编号逆序依次从从进程接收结果

C.按编号顺序、逆序交替从从进程接收结果

D.使用MPI_ANY_SOURCE和MPI_ANY_TAG


28.以下____是MPI基本原语。

A.MPI_barrier

B.MPI_Comm_numprocs

C.MPI_Comm_rank

D.MPI_Comm_Send


29.对于效率E,下面描述错误的是____。

A.理想并行E=1

B.总是在0~1之间

C.可能>1

D.可能随着处理器数量增大趋向于0


30.n个节点的二维mesh构造成本为____。

A.O(logn)

B.O(sqrt(n))

C.O(n)

D.O(nlogn)


31.OpenMP的缺点不包括____。

A.常见并行结构的表达并不总可行

B.局部性处理不易

C.不易编写多核单核通用程序

D.性能控制不易


32.对于加速比S和处理器数量p,下列说法正确的是____。

A.有可能S>p

B.必然S<p

C.不可能S=p

D.两者无关联


33.“提升时钟频率”方式提高CPU性能的限制因素不包括____。

A.物理制造局限

B.功耗问题

C.散热问题

D.软件设计问题


34.OpenMP的优点不包括____。

A.从头编写并行程序很自然

B.串行程序并行化简单

C.不必关心低层细节

D.可移植、可扩展


35.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。

A.单核CPU

B.多核CPU

C.FPGA

D.众核协处理器


36.SSE intrinsics _mm_hadd_ps命令的功能是____。

A.寄存器间单精度浮点数向量加法

B.寄存器间双精度浮点数向量加法

C.寄存器内单精度浮点数加法

D.寄存器内双精度浮点数加法


37.OpenMP不能实现的是____。

A.负责创建和管理线程

B.隐藏栈管理

C.提供同步机制

D.自动并行化


38.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。

A.时间局部性

B.空间局部性

C.计算局部性

D.混合局部性


39.SSE运算指令中未提供____指令。

A.算术运算

B.矩阵运算

C.逻辑运算

D.比较运算


40.C/C++语言存储二维数组采取____。

A.行主次序存储

B.列主次序存储

C.交错式存储

D.对角线存储


41.SSE intrinsics _mm_store_ss命令的功能是____。

A.对齐向量存单精度浮点数

B.未对齐向量存双精度浮点数

C.对齐标量存单精度浮点数

D.未对齐标量存双精度浮点数


42.n个节点的线性阵列构造成本为____。

A.O(logn)

B.O(sqrt(n))

C.O(n)

D.O(nlogn)


43.定期评选全球计算能力最强的超级计算机的国际组织是____。

A.top500

B.green500

C.graph500

D.super500


44.对于搜索分解,下面哪个说法是错误的_____。

A.所有子树搜索任务都必须全部完成

B.工作量可能大于串行计算

C.工作量可能小于串行计算

D.可能产生超线性加速比


45.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的


46.主线程通过____函数获取特定线程的返回结果。

A.pthread_create

B.pthread_join

C.pthread_cancel

D.pthread_get


47.静态任务划分相对于动态任务划分的缺点是____。

A.可能导致负载不均

B.通信开销高

C.计算复复杂度高

D.任务粒度粗


48.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是

A.读取x存在数据依赖,不能并发进行

B.累加顺序被改变,结果是错误的

C.加法操作是简单运算,无需同步

D.加法操作不是原子操作,需要同步保证数据依赖


49.GPU相对于其他众核产品的优势不包括____。

A.平台普及

B.有CUDA这样易学的开发工具

C.性价比高

D.由英伟达公司一家把控


50.SSE数据移动指令分类不包括____。

A.对齐传输

B.未对齐传输

C.标量传输

D.缓存传输




奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777

作业咨询 论文咨询
微信客服扫一扫

回到顶部