深度学习注意力机制考察要点-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

下面关于注意力机制的描述中，正确的是：

A. 与Encoder-Decoder相比，注意力模型中编码器将输入信息编码成一个向量

B. 在计算权重值时，与当前词越近，影响因子越大，权重值越大

C. Hard Attention会选择整个编码器的输出做为其输入，而Soft Attention则相反

D. 目前研究更倾向于使用Hard Attention，因为其可以直接求导，进行梯度反向传播

上一题

下一题

题目解析

题目评论(0)

关于注意力机制的描述，正确的选项是：B。

以下是对各个选项的分析：

A: 与Encoder-Decoder相比，注意力模型中编码器将输入信息编码成一个向量。
- 这是不正确的。在传统的Encoder-Decoder模型中，编码器将输入信息编码成一个固定长度的上下文向量，这个向量被传递给解码器。而注意力机制的引入正是为了克服这一限制，通过动态地为解码器的每一步生成不同的上下文向量。

B: 在计算权重值时，与当前词越近，影响因子越大，权重值越大。
- 这是正确的。在注意力机制中，通常计算上下文向量时会根据输入序列中每个位置的权重进行加权求和。与当前解码位置相关性越高的输入位置通常会被分配更大的权重，这在某些实现中可能与距离有关，但不一定总是如此，因为权重的计算是基于内容相似度而非物理距离。

C: Hard Attention会选择整个编码器的输出作为其输入，而Soft Attention则相反。
- 这是不正确的。Soft Attention是指对所有位置的编码器输出进行加权求和，生成一个上下文向量，而Hard Attention是指选择一个具体的位置进行处理，通常涉及采样，Hard Attention是非确定性的。

D: 目前研究更倾向于使用Hard Attention，因为其可以直接求导，进行梯度反向传播。
- 这是不正确的。实际上，Soft Attention更为常用，因为它是可微的，可以通过标准的反向传播进行训练。而Hard Attention由于涉及非确定性选择，通常需要使用强化学习或其他方法进行训练，反而更难以直接求导。

因此，正确的选项是B。