设 dk=dd_k=ddk=d 。
1.缩放点积得分 S=QKTdkS=\frac{QK^T}{\sqrt{d_k}}S=dkQKT
2.加掩码(如果提供) S←S+maskS←S+maskS←S+mask
本题属于以下题库,请选择所需题库进行购买
ScanQRCodePrompt
GoToPasswordLoginPrompt