网院作业 发表于 2021-4-13 14:51:39

21春南开《并行程序设计》在线作业百分

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《并行程序设计》在线作业
1.[单选题] 在下列应用中,SIMD最不适合____。
无忧答案网答案资料下载,请参考帮助中心说明
    A.图像处理
    B.音频处理
    C.科学计算
    D.数据库查询
    答:——D——
2.[单选题] MPI默认点对点通信模式是____。
    A.阻塞的
    B.非阻塞的
    C.对等的
    D.主从的
    答:——A——
3.[单选题] 对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用omp parallel for指令,第二种策略是对外层循环使用omp parallel指令,对内层循环使用omp for指令,后者相对于前者的优点是____。
    A.保持了数据依赖
    B.消除了大量线程创建、销毁开销
    C.有利于负载均衡
    D.减少了线程间交互
    答:——B——
4.[单选题] 单程序多数据流模式是针对____架构的。
    A.SISD
    B.SIMD
    C.MISD
    D.MIMD
    答:————
5.[单选题] for (i=0; i<16; i+=1) { L = A – B; D = D + abs(L); },此循环____。
    A.可完全向量化
    B.不可向量化
    C.不确定
    D.可部分向量化
    答:————
6.[单选题] MPI原址收发各一条消息的API是_____。
    A.MPI_Sendrecv
    B.MPI_Send
    C.MPI_Recv   福师 q164786 1640 更多答案进 ap5u.com
    D.MPI_Sendrecv_Replace
    答:————
7.[单选题] SSE是____平台的SIMD架构。
    A.x86
    B.POWER
    C.SPARC
    D.ARM
    答:————
8.[单选题] 以下超级计算机中,____不是SIMD架构。
    A.CDCSTAR-100
    B.757
    C.银河
    D.天河1号
    答:————
9.[单选题] 对于搜索分解,下面哪个说法是错误的_____。
    A.所有子树搜索任务都必须全部完成
    B.工作量可能大于串行计算
    C.工作量可能小于串行计算
    D.可能产生超线性加速比
    答:————
10.[单选题] 在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
    A.初始化
    B.第二个矩阵转置循环
    C.矩阵元素乘—加计算的循环
    D.结果输出
    答:————
11.[单选题] OpenMP默认采用____循环划分策略。
    A.静态
    B.固定
    C.动态
    D.自适应
    答:————
12.[单选题] 为缓解存储和CPU之间的性能差距,常见的技术手段不包括____。
    A.利用cache降低访存延迟
    B.利用多线程隐藏访存延迟
    C.利用预取隐藏访存延迟
    D.采用大容量内存提高访问速度
    答:————
13.[单选题] 在矩阵乘法之前将第二个矩阵转置,其作用不包括____。
    A.增大访存空间局部性
    B.减少运算次数
    C.优化SIMD访存
    D.以上皆错
    答:————
14.[单选题] MPI组通信操作不包括哪类____。
    A.通信
    B.同步
    C.点对点
    D.计算
    答:————
15.[单选题] OpenMP中指定多线程中只有主线程执行代码块的指令是____。
    A.omp single
    B.omp master
    C.omp slave
    D.omp parallel
    答:————
16.[单选题] Pthread支持____。
    A.线程间同步
    B.发现数据依赖
    C.自动线程化
    D.自动任务分配
    答:————
17.[单选题] 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
    A.必然主线程前、从线程后
    B.必然从线程前、主线程后
    C.必然相互交织
    D.各种顺序皆有可能
    答:————
18.[单选题] AVX是____平台的SIMD架构。
    A.x86
    B.POWER
    C.SPARC
    D.ARM
    答:————
19.[单选题] 控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。
    A.连续数据执行不同指令
    B.连续数据执行相同指令
    C.同一数据执行不同指令
    D.同一数据执行相同指令
    答:————
20.[单选题] 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
    A.2
    B.4
    C.8
    D.16
    答:————
21.[单选题] 一个Neon寄存器最多存放____个双精度浮点数。
    A.2
    B.4
    C.8
    D.16
    答:————
22.[单选题] 在共享内存架构编程中,线程间不能通过____进行通信
    A.全局变量
    B.局部变量
    C.静态变量
    D.全局堆中变量
    答:————
23.[单选题] CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
    A.8MFlops
    B.125MFlops
    C.1GFlops
    D.4GFlops
    答:————
24.[单选题] 在128位的SIMD寄存器中,我们不能保存____。
    A.16个8位整数
    B.8个16位短整型
    C.4个32位整型
    D.16个字符的字符串
    答:————
25.[单选题] 采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
    A.按编号顺序依次从从进程接收结果
    B.按编号逆序依次从从进程接收结果
    C.按编号顺序、逆序交替从从进程接收结果
    D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
    答:————
26.[单选题] 两个矩阵相乘,当矩阵规模大于cache大小时,平凡算法的问题是____。
    A.第一个矩阵访存时间局部性差
    B.第一个矩阵访存空间局部性差
    C.第二个矩阵访存时间局部性差
    D.第二个矩阵访存空间局部性差
    答:————
27.[单选题] MPI_Send和MPI_recv是通过____区分消息。
    A.端口号
    B.消息名
    C.消息标签
    D.消息哈希
    答:————
28.[单选题] 我国最近一次夺得全球超级计算机计算能力冠军的是____。
    A.天河1号
    B.天河1A
    C.天河2号
    D.神威.太湖之光
    答:————
29.[单选题] 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
    A.时间局部性
    B.空间局部性
    C.计算局部性
    D.混合局部性
    答:————
30.[单选题] 关于pthread_create函数,下列说法错误的是____。
    A.它返回是线程创建成功与否的错误码
    B.线程属性参数使用空指针表示使用默认参数
    C.它成功创建线程后立刻执行线程函数等待其结束后返回
    D.可通过它将参数传递给线程函数
    答:————
31.[单选题] 下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
    A.矩阵求和
    B.矩阵相乘
    C.矩阵向量相乘
    D.高斯消去
    答:————
32.[单选题] SSE intrinsics _mm_load_ss命令的功能是____。
    A.对齐向量读取单精度浮点数
    B.未对齐向量读取单精度浮点数
    C.对齐标量读取单精度浮点数
    D.未对齐标量读取单精度浮点数
    答:————
33.[单选题] 关于并行代价,下面描述正确的是____。
    A.总是小于串行时间
    B.总是大于并行时间
    C.总是与并行时间渐进相等
    D.以上皆错
    答:————
34.[单选题] 每个AVX寄存器宽度为____位。
    A.32
    B.64
    C.128
    D.256
    答:————
35.[单选题] SSE运算指令中未提供____指令。
    A.算术运算
    B.矩阵运算
    C.逻辑运算
    D.比较运算
    答:————
36.[单选题] 记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
    A.T'-T
    B.T-T'
    C.pT
    D.pT-T'
    答:————
37.[单选题] 使用____无法直接实现“主线程等待4个从线程完成任务”。
    A.1个信号量
    B.障碍
    C.1个互斥量
    D.4个互斥量
    答:————
38.[单选题] 指定线程间划分循环策略的OpenMP子句是____。
    A.shared
    B.reduction
    C.schedule
    D.nowait
    答:————
39.[单选题] 下列哪项不是这门课程的目标?
    A.学会肯定能优化程序性能的方法
    B.学会用并行思维思考问题
    C.学会常用的并行编程工具
    D.理解软件到并行架构的映射
    答:————
40.[单选题] 下面哪个问题相对而言更不适合进行数据并行____。
    A.求和
    B.排序
    C.向量加法
    D.矩阵乘法
    答:————
41.[单选题] 下面哪种架构最适合数据并行____。
    A.SISD
    B.SIMD
    C.MISD
    D.MIMD
    答:————
42.[单选题] 为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。
    A."#include "
    B."#pragma omp parallel"
    C."#ifdef _OPENMP"
    D."#define _OPENMP"
    答:————
43.[单选题] 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
    A.肯定快于
    B.肯定慢于
    C.可能快于
    D.以上皆错
    答:————
44.[单选题] SSE intrinsics _mm_store_ss命令的功能是____。
    A.对齐向量存单精度浮点数
    B.未对齐向量存双精度浮点数
    C.对齐标量存单精度浮点数
    D.未对齐标量存双精度浮点数
    答:————
45.[单选题] MPI基本原语不包括____。
    A.MPI_Barrier
    B.MPI_Comm_rank
    C.MPI_Comm_size
    D.MPI_Init
    答:————
46.[单选题] 一个AVX寄存器最多存放____个整型数。
    A.2
    B.4
    C.8
    D.16
    答:————
47.[单选题] 在使用信号量之前必须对其进行____。
    A.初始化
    B.加锁
    C.加1
    D.销毁
    答:————
48.[单选题] 主线程通过____函数获取特定线程的返回结果。
    A.pthread_create
    B.pthread_join
    C.pthread_cancel
    D.pthread_get
    答:————
49.[单选题] 静态任务划分相对于动态任务划分的优点是____。
    A.确保负载均衡
    B.任务粒度细
    C.计算复杂度低
    D.并行效率高
    答:————
50.[单选题] 当问题规模不变时,随着处理器数量增大,效率降低的性质对____成立。
    A.部分并行算法
    B.代价最优并行算法
    C.所有并行算法
    D.以上皆错
    答:————

转载注明 无忧答案网随机作业核对题目后下载答案
页: [1]
查看完整版本: 21春南开《并行程序设计》在线作业百分