南开23春学期(高起本:1709-2103、专升本高起专:1909-2103)《并行程序设计》在线作业【奥鹏满分答案】

未知 在线作业 2023-06-16 688

摘要:23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00001试卷总分:100  得分:100一、单选题 (共 50 道试题,共 100 分)1.当问题规模不变时,随着处理器数量增大,效率降低的性质对____成立。A.部分并行算法B.代价最...

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业-00001

试卷总分:100  得分:100

一、单选题 (共 50 道试题,共 100 分)

1.当问题规模不变时,随着处理器数量增大,效率降低的性质对____成立。

A.部分并行算法

B.代价最优并行算法

C.所有并行算法

D.以上皆错

 

2.Pthread不支持____。

A.创建并发执行线程

B.同步

C.非显式通信

D.自动并行化

 

3.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。

A.按编号顺序依次从从进程接收结果

B.按编号逆序依次从从进程接收结果

C.按编号顺序、逆序交替从从进程接收结果

D.使用MPI_ANY_SOURCE和MPI_ANY_TAG

 

4.在SSE intrinsics程序中整数数据类型是____。

A.__m128

B.__m128f

C.__m128d

D.__m128i

 

5.为持续提高CPU性能,以下说法正确的是____。

A.只需不断增加器件集成密度

B.只需不断提高频率

C.必须利用并行技术

D.只需提高功耗

 

6.超算领域软件应用的最高奖项是____。

A.图灵奖

B.菲尔茨奖

C.诺贝尔奖

D.戈登?贝尔奖

 

7.MPI_Send和MPI_recv是通过____区分消息。

A.端口号

B.消息名

C.消息标签

D.消息哈希

 

8.主线程通过____函数获取特定线程的返回结果。

A.pthread_create

B.pthread_join

C.pthread_cancel

D.pthread_get

 

9.CUDA内存层次中不包括____。

A.全局内存

B.共享内存

C.分布式内存

D.寄存器

 

10.一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有____线程。

A.4

B.5

C.6

D.7

 

11.pthread_rwlock_rdlock是对读写锁进行____操作。

A.加锁

B.解锁

C.加读琐

D.加写锁

 

12.在使用信号量之前必须对其进行____。

A.初始化

B.加锁

C.加1

D.销毁

 

13.SSE intrinsics _mm_store_ss命令的功能是____。

A.对齐向量存单精度浮点数

B.未对齐向量存双精度浮点数

C.对齐标量存单精度浮点数

D.未对齐标量存双精度浮点数

 

14.并行计算还主要用于国防、工程研究等领域,这种说法是____。

A.正确的

B.错误的

 

15.天河1号、天河2号、神威.太湖之光总体上都是____架构

A.单核

B.多核

C.众核

D.集群

 

16.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。

A.初始化

B.第二个矩阵转置循环

C.矩阵元素乘—加计算的循环

D.结果输出

 

17.关于消息传递编程的特点,以下说法正确的是____。

A.与共享内存一样有竞争条件

B.编程简单

C.需程序员考虑局部性

D.无需考虑进程间通信

 

18.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。

A.特殊硬件

B.通用硬件

C.非公开硬件

D.廉价硬件

 

19.下列哪门课程不是并行程序设计的先导课?

A.计算机概论

B.高级语言程序设计

C.计算机体系结构

D.数据库系统

 

20.Flynn分类法中,下面哪种体系结构非常适合向量/矩阵计算的并行化?

A.SISD

B.SIMD

C.MISD

D.MIMD

 

21.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。

A.增大了元素比较距离

B.减小了元素比较距离

C.改为元素两两分组比较

D.消除了元素比较

 

22.并行算法运行时间是指____。

A.最快进程花费时间

B.所有进程平均花费时间

C.所有进程花费总时间

D.最慢进程花费时间

 

23.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。

A.1

B.2

C.3

D.4

 

24.编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。

A.创建和管理线程代码

B.循环划分给线程的代码

C.找出数据依赖的代码

D.线程同步的代码

 

25.当前CPU性能提升已从依赖时钟频率提升转为更多依赖____。

A.多核和众核技术

B.突破物理局限

C.改善散热

D.采用新材料

 

26.n个节点的线性阵列中,节点最远通信距离为____。

A.1

B.O(logn)

C.O(sqrt(n))

D.O(n)

 

27.SIMD架构中,_____。

A.唯一控制单元控制所有计算单元

B.每个计算单元独有控制单元

C.一组计算单元共享一个控制单元

D.以上皆错

 

28.以下超级计算机中,____是SIMD架构。

A.CRAY-1

B.天河1A

C.天河2号

D.神威.太湖之光

 

29.使用____无法直接实现“主线程等待4个从线程完成任务”。

A.1个信号量

B.障碍

C.1个互斥量

D.4个互斥量

 

30.适合进行SIMD并行化的串行程序特点不包括____。

A.大数据对象

B.数据项连续存储

C.流式计算

D.算术计算密集

 

31.OpenMP的缺点不包括____。

A.常见并行结构的表达并不总可行

B.局部性处理不易

C.不易编写多核单核通用程序

D.性能控制不易

 

32.多对多广播/归约高效算法基于____。

A.递归思想

B.流水线思想

C.分治思想

D.贪心思想

 

33.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

A.2

B.4

C.8

D.16

 

34.对于障碍同步机制,以下说法错误的是____。

A.SIMD架构无需障碍机制

B.是一种群体同步机制

C.可用信号量实现

D.无法用其他同步机制实现

 

35.互斥量mutex机制,在任何时刻____进入它保护的区域。

A.允许任意数量任意类型的线程

B.允许一个读线程任意个写线程

C.允许一个写线程任意个读线程

D.只允许一个线程

 

36.多线程是____架构下的并行模式。

A.MIMD

B.共享内存

C.分布式内存

D.分离式地址空间

 

37.一个AVX寄存器最多存放____个双精度浮点数。

A.2

B.4

C.8

D.16

 

38.在下列应用中,SIMD最不适合____。

A.图像处理

B.音频处理

C.科学计算

D.数据库查询

 

39.AVX是____平台的SIMD架构。

A.x86

B.POWER

C.SPARC

D.ARM

 

40.记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。

A.pT

B.T'+T

C.p(T'-T)

D.pT-T'

 

41.在共享内存架构编程中,线程间不能通过____进行通信

A.全局变量

B.局部变量

C.静态变量

D.全局堆中变量

 

42.以下哪种数据集合不能用一个MPI的自定义数据类型表示____。

A.对角矩阵元素

B.矩阵中为0元素

C.矩阵中一列元素

D.上三角矩阵中元素

 

43.下列指令集中___不是SIMD指令集。

A.SSE

B.Neon

C.AVX

D.EMT64

 

44.循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。

A.循环变量应为带符号整数

B.终止检测必须是与循环不变量的比较

C.循环变量每步递增/递减一个循环不变量

D.循环体无进/出控制流

 

45.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。

A.肯定快于

B.肯定慢于

C.可能快于

D.以上皆错

 

46.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则两次执行程序的输出顺序____。

A.必然都是0 1 2 3

B.必然不同

C.可能不同

D.必然相同但不一定是0 1 2 3

 

47.从线程检查主线程是否要求它退出应采用____。

A.pthread_join

B.pthread_cancel

C.pthread_testcancel

D.pthread_exit

 

48.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。

A.架构设计更容易

B.更易突破物理极限

C.能更充分利用现有资源

D.功耗优势明显

 

49.OpenMP编译指示的作用范围是____。

A.其后一个语句

B.其后连续语句

C.其后直到函数结束

D.整个函数

 

50.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。

A.已有一个线程上了读锁

B.已有一个线程上了写锁

C.已有多个线程上了读锁

D.已有多个线程上了写锁


相关推荐

评论列表
友情链接
关闭

用微信“扫一扫”