选择题

会员专享

请先登录，登录后可使用今日免费解锁；开通会员，或购买该题目所属题库（美团机考编程题库），可解锁完整内容。

购买题库开通会员

1、

答案：B. 使用位置编码的目的是为了让模型获得序列中每个token的上下文信息

解析：位置编码的作用是给模型提供位置信息/顺序信息，不是直接提供上下文信息。上下文信息主要来自注意力机制对其他 token 的建模。

1、下面关于大模型中使用的Position Encoding机制，说法错误的是（）

2、在一棵度为4的树T中，若有10个度为4的结点，15个度为3的结点，4个度为2的结点，9个度为1的结点，则树T的叶结点个数是（）

3、预训练任务NSP（Next Sentence Prediction）的作用是（）

4、下列哪个数据结构不属于设备分配（）

5、RAG出现“召回相关但回答仍不对”，更常见的排查顺序是（）

6、做模型蒸馏时，学生模型在训练集拟合很好，但线上对长尾问题泛化差。更可能的原因是（）

7. 下列选项中，在升序有序表中进行折半查找，能构成折半查找中关键字比较序列的是（）

8、分布式训练偶发卡在allreduce附近，日志显示某个rank提前退出。更可能的原因是（）

9、参数高效微调方法（如LoRA）的主要优势是（） {{ select(9) }}

10、以下哪种状态码表示服务器成功处理请求但未返回内容？

请从“运行结果”或“历史提交”选择一条记录

选择提交后开始分析

#P4673. 选择题