#P3551. 第1题-选择题
          
                        
                                    
                      
        
              - 
          
          
          
                      Tried: 742
            Accepted: 112
            Difficulty: 5
            
          
          
          
                       所属公司 : 
                              华为
                                
            
                        
              时间 :2025年9月3日-国内-AI
                              
                      
          
 
- 
                        算法标签>数学          
 
第1题-选择题
思路:样本量大 (n=100),次品率小 (p=0.02),二项分布 B(100,0.02) 可近似为泊松分布 λ=np=2。
答案:C. 泊松分布 ✅
思路:长文本生成需要捕捉长期依赖,LSTM 比 HMM 和传统方法更适合。
答案:C. LSTM
思路:迭代公式 xk+1=cos(xk) 有唯一不动点,且迭代收敛与初值无关。
答案:A. 对任意初始值,该算法都能收敛到其唯一实根
思路:t 检验用于均值比较并以正态性为前提,不是正态性检验方法。
答案:C. T检验
思路:牛顿法遇到重根时收敛速度由二次降为线性。
答案:C. 线性收敛
思路:真值 σ(1.5)=100+20(1.5)+5(1.5)2=141.25,
插值 P2(1.5)=100+20(1.5)+5(1.5)(0.5)=133.75。
答案:C. 7.5 MPa
线性变换 T 满足:
$$T(\mathbf{v}) = T\left(4\mathbf{e}_1 + 3\mathbf{e}_2\right) = 4T(\mathbf{e}_1) + 3T(\mathbf{e}_2) = 4\begin{bmatrix}3\\1\end{bmatrix} + 3\begin{bmatrix}-1\\2\end{bmatrix} = \begin{bmatrix}12-3\\4+6\end{bmatrix} = \begin{bmatrix}9\\10\end{bmatrix} $$答案:B
思路:将 βi 在基 (α1,α2,α3) 下的坐标组成矩阵
$\begin{pmatrix}k_1&1&k_1\\1&k_2&k_2+1\\1&1&1\end{pmatrix}$,
其行列式 det=−k2(k1−1),线性相关当且仅当为 0。
答案:D. k1=1 或 k2=0
思路:概率密度函数在区间 [a,b] 上常数为 b−a1,其余为 0,即均匀分布。
答案:D. 均匀分布
思路:矩阵 A=uvT,其中 u=[2,−1,3]T,v=[4,0,−2]T。 则 A23=u2⋅v3=(−1)⋅(−2)=2。 答案:B. 2
思路:训练集表现很好,但测试集效果差,说明模型过拟合。
答案:B. 过拟合
思路:线性变换 Y=3X−5,有 Var(Y)=32Var(X)=9×4=36。
答案:C. 36
思路:PCA 选择主成分的标准是方差贡献率,方差越大说明信息量越大。
答案:A. 主成分的方差贡献率
思路:线性变换满足齐次性与可加性,正确的是 T(cu)=cT(u)。
答案:A. T(cu)=cT(u) 对所有标量 c 和向量 u 成立
思路:解码器只有第一个 Multi-Head Attention 使用 Masked Self-Attention,第二个是 Cross-Attention。
答案:D. 解码器的第二个 Multi-Head Attention 采用了 Masked 掩码操作
思路:GMM 的 M-step 中,分权需归一化为 1,均值更新为加权平均,协方差矩阵需正定(但不限于对角)。
答案:A, C, D
思路:线性映射满足齐次与可加性;线性映射之和仍线性;含常数项“+1”非线性;矩阵形式的是线性。
答案:A,B,D
思路:泊松过程有 E[N(t)]=λt;给定 N(t)=n 时,发生时刻为 n 个独立同分布的 U(0,t)(其有序为次序统计量);首达时 T1∼Exp(λ),且相邻间隔独立同分布。
答案:A,B,C,D
思路:Tanh 输出范围 [−1,1] 正确;Sigmoid 导数在 0 处最大,输入远离 0 时趋近 0 正确;Softmax 输出归一化为概率分布正确;ReLU 对负输入为 0,对正输入输出自身正确。
答案:A,B,C,D
思路:多模态模型相比 LLM,会遇到模态对齐、跨模态语义理解与生成、实时处理延迟,以及参数量激增等挑战。
答案:A,B,C,D
单选题(1–15)
1、某工厂生产的产品次品率为0.02,随机抽取100件产品,次品数X 近似服从的分布是? {{ select(1) }}
- 伯努利分布
 - 均匀分布
 - 泊松分布
 - 正态分布
 
2、在文本生成中,以下哪种模型最适合用于生成连贯的长文本 {{ select(2) }}
- 最大熵模型
 - 决策树
 - LSTM
 - 隐马尔可夫模型(HMM)
 
3、在计算某天线的安装角度时,需要求解如下非线性方程 x=cosx
工程师小王打算使用迭代公式
xk+1=cos(xk)
进行数值计算。以下有关该迭代收敛性的说法中,哪一项是正确的? {{ select(3) }}
- 对任意初始值,该算法都能收敛到其唯一实根
 - 该算法是不稳定的,因为余弦函数有界,而线性函数无界
 - 该方程有两个实根,算法收敛到哪一个取决于初始值
 - 当算法收敛时,收敛速度是二次的
 
4、下述检验正态性假设的方法中错误的是 {{ select(4) }}
- 直方图方法
 - 拟合优度检验方法
 - T检验
 - 使用偏度系数和峰度系数
 
5、用牛顿迭代法求函数(x+3)x2=0 的根,初值为 x0=3的情况下,其收敛速度是 {{ select(5) }}
- 二次收敛
 - 对数收敛
 - 线性收敛
 - 超线性收敛
 
6、桥梁应力监测中,传感器测得:t=[0,1,2]秒时σ=[100,120,150]MPa。用二次插值P2(t)=100+20t+5t(t−1)预测t=1.5秒应力。已知真实应力函数为σ(t)=100+20t+5t2,则应力预测值的绝对误差是? {{ select(6) }}
- 0.0Mpa
 - 5.0Mpa
 - 7.5Mpa
 - 2.5Mpa
 
7、线性变换T:R2→R2将基向量$\mathbf{e}_{1}=\left[\begin{array}{l}1 \\0\end{array}\right]$。映射为[31],将$\mathbf{e}_{2}=\left[\begin{array}{l}0 \\1\end{array}\right]$映射为[−12]。则向量$\mathbf{v}=\left[\begin{array}{l}4 \\3\end{array}\right]$周在T下的像为? {{ select(7) }}
- [12−2]
 - [910]
 - [811]
 - [57]
 
8、向量组α1,α2,α3线性无关,已知$\beta_{1}=k_{1} \alpha_{1}+\alpha_{2}+k_{1} \alpha_{3}$,$\beta_{2}=\alpha_{1}+k_{2} \alpha_{2}+\left(k_{2}+1\right) \alpha_{3}$,β3=α1+α2+α3,若β1,β2,β3线性相关,则k1,k2的值为() {{ select(8) }}
- k1=1且k2=0
 - k1=1或k2=1
 - k1=1且k2=1
 - k1=1或k2=0
 
9、设随机变量X的概率密度函数为f(x)=b−a1a(a≤x≤b),其他情况为0。该分布是: {{ select(9) }}
- 正态分布
 - 指数分布
 - 泊松分布
 - 均匀分布
 
10、给定向量 $\mathbf{u}=\left[\begin{array}{l}2 \\-1\\3\end{array}\right]$,$\mathbf{v}=\left[\begin{array}{l}4 \\0\\-2\end{array}\right]$,矩阵 A=uvT,则A的第2行第3列元素是?(行号列号从1开始计数) {{ select(10) }}
- 0
 - 2
 - 6
 - -4
 
11、你正在使用一个机器学习模型来解决一个分类问题,在训练集上得到了非常高的准确率,但是在测试集上的准确率却相对较低。这种情况最有可能是以下哪种现象? {{ select(11) }}
- 欠拟合
 - 过拟合
 - 无法判断
 - 正好拟合
 
12、在进行特征工程时,我们经常会对特征进行标准化处理。假设有一个特征X,其期望E[X]=10,方差Var(X)=4。现在我们对其进行线性变换得到新特征Y=3X-5。那么新特征Y的方差Var(Y)是多少? {{ select(12) }}
- 12
 - 7
 - 36
 - 31
 
13、在使用 PCA(主成分分析)进行降维时,主要依据以下哪一项来选择主成分? {{ select(13) }}
- 主成分的方差贡献率
 - 数据的类别分布
 - 样本的分布密度
 - 特征之间的相关性
 
14、关于线性变换 T:Rn→Rm,以下说法正确的是? {{ select(14) }}
- T(cu)=cT(u) 对所有标量 c 和向量 u 成立
 - 零向量映射不一定为零向量
 - 线性变换不能改变向量的维度
 - T(u+v)=T(u)+T(v) 仅当 u⊥v 时成立
 
15、关于transformer解码器的描述错误的是? {{ select(15) }}
- 解码器额外使用编码器-解码器交叉注意力层(Cross-Attention)
 - 解码器包含掩码自注意力层(Masked Self-Attention)
 - 第二个 Multi-Head Attention 层的K,V矩阵使用 Encoder 的编码信息矩阵进行计算
 - 解码器的第二个Multi-Head Attention采用了Masked掩码操作
 
多选题(16–20)
16、在 EM 算法中,GMM的 M-step 的解析解需要 {{ multiselect(16) }}
- 各成分权重和为 1
 - 必须对角协方差
 - 协方差矩阵正定
 - 均值更新为加权平均
 
17、下列关于线性变换的说法中,正确的是() {{ multiselect(17) }}
- 若 T:Rn→Rm 是线性变换,则对于任意向量 α,β∈Rn 和常数 k,m∈R ,有 T(kα+mβ)=kT(α)+mT(β)
 - 若 T1,T2 均为 T:Rn→Rm 的线性变换,则它们的和 T(x)=T1(x)+T2(x) 仍是线性变换
 - 设T:R3→R2 是讲向量 xyz映射为 $\left[\begin{array}{l}x+y+1 \\z-2y\end{array}\right]$的变换,则 T 是线性变换
 - 设T:R2→R2 是讲向量 [xy]映射为 $\left[\begin{array}{l}2x+y \\x-3y\end{array}\right]$的变换,则 T 是线性变换
 
18、设 {N(t),t≥0} 是强度为 λ 的泊松过程。以下陈述中,正确的是 {{ multiselect(18) }}
- 在区间 [0,t] 内事件数 N(t) 的均值为 λt
 - 已知在时间 [0,t] 内发生了 n 个事件,那么这 n 个事件的发生时刻在 [0,t] 上是独立同分布的均匀分布
 - 时间间隔 T1 (首次事件到达时间) 服从参数为 λ 的指数分布
 - 两次连续事件的时间间隔 T2−T1 与 T1 相互独立
 
19、关于深度学习中的激活函数 ReLU、Softmax、Sigmoid 和 Tanh,以下描述正确的是: {{ multiselect(19) }}
- Tanh 函数的输出值范围在 [−1,1] 之间,常用于隐藏层的激活函数。
 - Sigmoid 函数的导数在输入为 0 时达到最大值,随着输入值的增大或减小而逐渐减小。
 - Softmax 函数将输入值归一化为概率分布,所有输出值的和为 1 。
 - ReLU 函数在输入为负时输出为零,而在输入为正时输出为输入值本身。
 
20、与大语言模型(LLM)相比,以下哪些是多模态大语言模型(MLLM)在处理多模态输入时面临的独特挑战? {{ multiselect(20) }}
- 多模态数据的对齐(如图像与文本的语义对齐)
 - 跨模态的语义理解与生成
 - 多模态输入的实时处理与推理延迟
 - 模型参数量的爆炸式增长