请在仅使用 numpynumpynumpy 的前提下,实现单头 Scaled−DotScaled-DotScaled−Dot ProductProductProduct AttentionAttentionAttention 的前向计算。
输入为 Query(Q),Key(K),Value(V)Query(Q),Key(K),Value(V)Query(Q),Key(K),Value(V) 三矩阵和可选 attention_maskattention\_maskattention_mask 。
设 dk=dd_k=ddk=d 。
1.缩放点积得分 S=QKTdkS=\frac{QK^T}{\sqrt{d_k}}S=dkQKT
本题属于以下题库,请选择所需题库进行购买
ScanQRCodePrompt
请使用微信扫描下方二维码完成注册