第3题-多头注意力掩码计算 - problem_ide - CodeFun2000

访问过于频繁

您的访问过于频繁，请稍后再试。

会员专享

请先登录，登录后可使用今日免费解锁；开通会员，或购买该题目所属题库（华为校招机考题库），可解锁完整内容。

购买题库开通会员

解题思路

对每个 Batch 和每个 Head 独立处理一个 $S \times S$ 的得分矩阵，输出顺序与输入顺序一致。
对于第 $b$ 个 Batch，设有效长度为 $L_b$ 。若行索引 $i \ge L_b$ ，说明该查询位置本身是 Padding，整行输出全 $0$ 。
否则该行的有效列必须同时满足因果掩码和 Padding 掩码，即 $0 \le j \le i$ 且 $j < L_b$ 。
对有效位置计算位置惩罚后的值： $v_j = Score_{i,j} - (i-j)\times(s+1)$

编辑器加载中…

输入

预期输出（选填）