1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

1. LoRA 思路

  • 原始权重 WqW_qWq​ 冻结;

  • 新增低秩矩阵 A∈Rr×d,B∈Rd×rA\in \mathbb{R}^{r\times d}, B\in \mathbb{R}^{d\times r}A∈Rr×d,B∈Rd×r,形成:

    Wq′=Wq+BAW_q' = W_q + BA Wq′​=Wq​+BA
  • 若 r=0r=0r=0,直接用原始 WqW_qWq​。

P3658.第3题-支持LoRA的Attention实现

    1000ms Tried: 1213 Accepted: 289 Difficulty: 7 所属公司 : 华为
    算法与标签>模拟

题目内容

相对于全量微调,LoRALoRALoRA微调提出了一种低秩分解的方法,只需在原模型参数基础上增加少量的可训练参数,大幅降低计算成本和内存占用。具体而言,对于原始的预训练权重矩阵WWW,LORALORALORA做以下改进:

W′=W+B×AW'=W+B×AW′=W+B×A

WWW为原始权重(冻结不变),B∈Rd×rB∈R^{d×r}B∈Rd×r和 A∈Rr×dA ∈R^{r×d}A∈Rr×d为新增的低秩矩阵,r<<dr<<dr<<d,秩rrr一般很小。微调时只更新 A、BA、BA、B这两个矩阵,显著减少训练的参数数量。请实现支持LoRALoRALoRA的AttentionAttentionAttention计算

函数LoRA_Attention(x,Wa,Wk,Wv,A,B) LoRA\_Attention(x,W_a,W_k,W_v,A,B)LoRA_Attention(x,Wa​,Wk​,Wv​,A,B) 。为简化实现,仅需支持AttentionAttentionAttention中Q QQ的LoRALoRALoRA结构实现即可。实现时请使用float64float64float64位精度。

输入描述

第111行: b,d,rb,d,rb,d,r,其中b为batch sizeb为batch\ sizeb为batch size,ddd为特征的长度,rrr为LoRALoRALoRA矩阵的秩,b≥1,d≥1,r≥0b≥1,d≥1,r≥0b≥1,d≥1,r≥0

第222行:输入xxx,长度为b×db×db×d

第3−53-53−5行: Wq,Wk,WvW_q,W_k,W_vWq​,Wk​,Wv​,长度为d×dd×dd×d

若r>0r>0r>0,则:

第666行:AAA,长度为r×dr×dr×d

第777行:BBB,长度为d×rd×rd×r

输出描述

LoRAAttentionLoRA AttentionLoRAAttention计算的结果,输出保留四位小数,不足四位小数的补000

样例1

输入

2 5 3
-0.58 -0.52 -0.02 0.56 0.79 0.06 -0.64 -0.04 -0.20 -0.38
0.24 -0.72 -0.66 0.96 0.02 -0.43 -0.24 0.19 -0.85 -0.35 0.69 -0.09 0.99 0.21 -0.06 0.55 0.57 0.97 0.58 -0.16 0.64 0.02 -0.71 0.53 -0.90
0.07 -0.16 -0.47 -0.32 -0.92 0.13 -0.74 -0.87 0.05 0.33 0.37 0.75 0.57 0.14 -0.62 0.67 -0.62 -0.85 0.09 -0.90 0.22 0.97 -0.68 0.61 0.48
0.39 -0.74 0.84 0.21 0.44 -0.59 -0.07 -0.84 -0.70 0.86 -0.12 -0.06 0.45 -0.43 -0.09 -0.73 0.56 -0.62 0.36 -0.87 -0.97 -0.48 0.71 0.07 -0.28
0.25 0.58 -0.04 -0.94 0.45 -0.60 0.89 0.94 0.35 -0.76 -0.47 -0.40 0.10 0.23 0.25
-0.18 -0.11 0.60 0.37 0.75 0.51 -0.76 -0.39 -0.81 -0.88 -0.43 -0.88 0.15 -0.46 -0.24

输出

0.3499 0.0803 0.0376 -0.1791 0.3952 0.4112 0.2240 -0.0239 -0.2177 0.4478

样例2

输入

1 3 2
0.58 -0.65 -0.63
-0.74 -0.71 0.65 0.70 -0.14 0.01 -0.84 0.20 0.25
-0.60 0.51 -0.12 -0.35 0.57 -0.38 -0.44 -0.82 0.53
0.14 0.03 -0.27 0.10 -0.12 0.85 -0.55 0.10 -0.43
0.65 0.32 -0.42 -0.62 -0.88 -0.70
-0.66 0.49 0.09 -0.21 0.48 0.41

输出

0.2318 -0.3995 -0.1131

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 3, 51ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?