南开21春学期《并行程序设计》在线作业（标准答案）-奥鹏学无忧教育辅导

可做奥鹏院校所有作业，毕业论文，咨询请添加QQ：3230981406 微信：aopopenfd777

21春学期（1709、1803、1809、1903、1909、2003、2009、2103）《并行程序设计》在线作业
试卷总分:100 得分:100
第1题,利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A、降低了访存延迟
B、隐藏了访存延迟
C、利用了cache空间局部性
D、利用了cache时间局部性
正确答案:

第2题,for (i=2; i10; i++) A[i] = A[i-2]+1; 此循环____数据依赖。
A、存在
B、不存在
C、不确定
D、以上皆错
正确答案:

第3题,记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
A、T'-T
B、T-T'
C、pT
D、pT-T'
正确答案:

第4题,OpenMP的优点不包括____。
A、从头编写并行程序很自然
B、串行程序并行化简单
C、不必关心低层细节
D、可移植、可扩展
正确答案:

答案来源：（www.）,编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。
A、2
B、4
C、8
D、16
正确答案:

第6题,两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。
A、先将两个矩阵读入cache再进行乘法
B、先转置第一个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错
正确答案:

第7题,MPI不包括的通信类别是____。
A、点对点通信
B、数据传输组通信
C、计算和数据传输组通信
D、加锁解锁通信
正确答案:

第8题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间____。
A、任意一个串行算法
B、作为并行算法基础的那个串行算法
C、已知最优的串行算法
D、所有串行算法的平均时间
正确答案:

第9题,在128位的SIMD寄存器中,我们不能保存____。
A、16个8位整数
B、8个16位短整型
C、4个32位整型
D、16个字符的字符串
正确答案:

答案来源：（www.）,在使用互斥量之前必须对其进行____。
A、初始化
B、加锁
C、解锁
D、销毁
正确答案:

第11题,对于效率E,下面描述错误的是____。
A、理想并行E=1
B、总是在0~1之间
C、可能1
D、可能随着处理器数量增大趋向于0
正确答案:

答案来源：（www.）,n个节点的线性阵列中,节点最远通信距离为____。
A、1
B、O(logn)
C、O(sqrt(n))
D、O(n)
正确答案:

第13题,对矩阵每行排序的程序进行多线程并行化,对矩阵采用____。
A、简单均匀块划分即可保证负载均衡
B、循环划分才能实现负载均衡
C、动态划分才能实现负载均衡
D、随机划分才能实现负载均衡
正确答案:

第14题,如果运算对象是独立无关的变量,则在向量运算之前需____。
A、将变量拷贝到连续区域
B、将变量地址拷贝到连续区域
C、将变量逐个传输到向量寄存器
D、以上皆错
正确答案:

答案来源：（www.）,我国最近一次夺得全球超级计算机计算能力冠军的是____。
A、天河1号
B、天河1A
C、天河2号
D、神威.太湖之光
正确答案:

第16题,OpenMP能实现的是____。
A、避免数据竞争
B、提供任务划分策略
C、确保加速
D、确保降低通信开销
正确答案:

第17题,SIMD并行模式是将多个____运算打包并发执行。
A、不同
B、相同
C、混合
D、依赖
正确答案:

第18题,pthread_create函数中设置一个参数为"线程函数参数"的原因是____。
A、它调用线程函数时可直接传递，性能更优
B、它需要预处理之后传递给线程函数
C、线程函数不是用户程序调用，只能采用这种方式由系统代为传递参数
D、没有特别用意
正确答案:

第19题,SSE有____个专用寄存器。
A、4
B、8
C、16
D、33
正确答案:

答案来源：（www.）,全球500强超算在操作系统上越来越体现出____一家独大的趋势。
A、Unix
B、Windows
C、Linux
D、ios
正确答案:

第21题,条件变量相对于互斥量的优点是____。
A、是多源状态
B、加锁解锁开销低
C、条件不成立时阻塞线程并自动解锁加锁
D、以上皆错
正确答案:

第22题,当条件判断____时,控制流语句SIMD并行化可能达到较好效果。
A、绝大部分结果为真
B、绝大部分结果为假
C、全部结果都一样
D、绝大部分结果都一样
正确答案:

第23题,将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A、_mm_set_ps
B、_mm_set1_ss
C、_mm_setzero_ss
D、_mm_setzero_ps
正确答案:

第24题,OpenMP归约指令采用的是一种____算法。
A、分治
B、贪心
C、动态规划
D、排序
正确答案:

答案来源：（www.）,单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A、等于8
B、小于8
C、4到8之间
D、等于4
正确答案:

第26题,OpenMP中指定多线程中只有主线程执行代码块的指令是____。
A、omp single
B、omp master
C、omp slave
D、omp parallel
正确答案:

第27题,pthread_join的作用是____。
A、强制终止指定线程
B、检测指定线程是否结束
C、等待指定线程结束才返回
D、向指定线程发送数据
正确答案:

第28题,静态线程编程模式的缺点是____。
A、线程管理开销高
B、系统资源利用率低
C、线程负载不均
D、线程通信开销高
正确答案:

第29题,用pthread_barrier_init初始化障碍,应提供的参数不包括____。
A、障碍对象
B、障碍初值
C、障碍属性
D、参与的线程数
正确答案:

答案来源：（www.）,SSE指令移动单精度浮点数,不能实现____。
A、将64位数据移动到SSE寄存器高位
B、将64位数据移动到SSE寄存器低位
C、将32位数据移动到SSE寄存器指定位置
D、在两个SSE寄存器高/低64位间移动
正确答案:

第31题,并行计算的新兴应用领域不包括____。
A、制药
B、数字媒体
C、国防
D、游戏
正确答案:

第32题,互斥量mutex机制,在任何时刻____进入它保护的区域。
A、允许任意数量任意类型的线程
B、允许一个读线程任意个写线程
C、允许一个写线程任意个读线程
D、只允许一个线程
正确答案:

第33题,对于向线程函数传递参数,下列说法错误的是____。
A、线程函数并非用户程序调用，因此无法直接传递
B、线程函数必须接受void *参数，因此只能传递大小不超过指针的数据对象
C、线程通常通过此途径获取线程号
D、不同线程间的参数传递相互无关，即使它们具有相同的线程函数
正确答案:

第34题,OpenMP不会自动地在____位置设置barrier。
A、并行结构开始
B、并行结构结束
C、其他控制结构开始
D、其他控制结构结束
正确答案:

第35题,SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[1]=j则表示___。
A、将第一个源寄存器的第j个元素放在目标寄存器位置1
B、将第二个源寄存器的第j个元素放在目标寄存器位置1
C、将第一个源寄存器的第1个元素放在目标寄存器位置1
D、将第二个源寄存器的第1个元素放在目标寄存器位置1
正确答案:

第36题,适合进行SIMD并行化的串行程序特点不包括____。
A、大数据对象
B、数据项连续存储
C、流式计算
D、算术计算密集
正确答案:

第37题,对于加速比S和处理器数量p,下列说法正确的是____。
A、有可能Sp
B、必然Sp
C、不可能S=p
D、两者无关联
正确答案:

第38题,采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加___前缀。
A、__global__
B、__device___
C、__shared__
D、__private__
正确答案:

第39题,在条件不成立时,使用pthread_cond_wait____。
A、令线程阻塞
B、解锁互斥量
C、解锁互斥量然后令线程阻塞
D、加锁互斥量
正确答案:

第40题,关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A、程序员需要编写线程创建和管理代码
B、程序员需要编写循环划分代码
C、程序员需要编写调度策略代码
D、程序员只需指出对哪个循环进行并行，循环划分和调度策略是什么
正确答案:

第41题,OpenMP主要是通过____来更高层抽象的多线程编程。
A、设计实现新的语言
B、为现有语言提供大量库函数
C、为现有语言扩展编译指示
D、新编译器实现自动并行化
正确答案:

第42题,CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
A、8MFlops
B、125MFlops
C、1GFlops
D、4GFlops
正确答案:

第43题,CUDA共享内存是由____共享。
A、Grid中所有线程
B、一个Block中所有线程
C、一个Warp中所有线程
D、GPU中所有线程
正确答案:

第44题,1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
A、1)
B、2)
C、不确定
D、以上皆错
正确答案:

第45题,并行计算还主要用于国防、工程研究等领域,这种说法是____。
A、正确的
B、错误的
正确答案:

第46题,当问题规模不变时,随着处理器数量增大,加速比____。
A、必然增大
B、必然减小
C、必然不变
D、以上皆错
正确答案:

第47题,pthread_join的第二个参数的作用是____。
A、设置指定线程属性
B、获取指定线程属性
C、向指定线程传递参数
D、获取指定线程函数返回结果
正确答案:

第48题,在使用条件变量时,还需配套使用一个____。
A、互斥量
B、信号量
C、障碍
D、自旋锁
正确答案:

第49题,矩阵每行排序的问题更适合使用MPI的____编程模型。
A、阻塞的
B、非阻塞的
C、对等的
D、主从的
正确答案:

答案来源：（www.）,SSE intrinsics _mm_load_ss命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐标量读取单精度浮点数
D、未对齐标量读取单精度浮点数
正确答案:

微信客服扫一扫