Problem Tags
- 数据结构
- 2
- 动态规划
- 2
- 模拟
- 2
- LoRA微调
- 1
- 线性代数
- 1
- 矩阵乘法
- 1
- softmax
- 1
- 缩放点积注意力
- 1
- 多头拆分/拼接
- 1
- 因果遮罩
- 1
- 逻辑回归
- 1
- One-Hot 编码
- 1
- SGD
- 1
- 并查集
- 1
- 反向传播
- 1
- 稀疏注意力机制
- 1
- 其他
- 1
- 构造
- 1
Scan the QR code below with WeChat to sign in
First-time scan will create your account automatically
请使用微信扫描下方二维码完成注册