#P3551. 第1题-选择题
-
ID: 2895
Tried: 679
Accepted: 96
Difficulty: 5
所属公司 :
华为
时间 :2025年9月3日-国内-AI
-
算法标签>选择题
第1题-选择题
思路:样本量大 (n=100),次品率小 (p=0.02),二项分布 B(100,0.02) 可近似为泊松分布 λ=np=2。
答案:C. 泊松分布 ✅
思路:长文本生成需要捕捉长期依赖,LSTM 比 HMM 和传统方法更适合。
答案:C. LSTM
单选题(1–15)
1、某工厂生产的产品次品率为0.02,随机抽取100件产品,次品数X 近似服从的分布是? {{ select(1) }}
- 伯努利分布
- 均匀分布
- 泊松分布
- 正态分布
2、在文本生成中,以下哪种模型最适合用于生成连贯的长文本 {{ select(2) }}
- 最大熵模型
- 决策树
- LSTM
- 隐马尔可夫模型(HMM)
3、在计算某天线的安装角度时,需要求解如下非线性方程 x=cosx
工程师小王打算使用迭代公式
xk+1=cos(xk)
进行数值计算。以下有关该迭代收敛性的说法中,哪一项是正确的? {{ select(3) }}
- 对任意初始值,该算法都能收敛到其唯一实根
- 该算法是不稳定的,因为余弦函数有界,而线性函数无界
- 该方程有两个实根,算法收敛到哪一个取决于初始值
- 当算法收敛时,收敛速度是二次的
4、下述检验正态性假设的方法中错误的是 {{ select(4) }}
- 直方图方法
- 拟合优度检验方法
- T检验
- 使用偏度系数和峰度系数
5、用牛顿迭代法求函数(x+3)x2=0 的根,初值为 x0=3的情况下,其收敛速度是 {{ select(5) }}
- 二次收敛
- 对数收敛
- 线性收敛
- 超线性收敛
6、桥梁应力监测中,传感器测得:t=[0,1,2]秒时σ=[100,120,150]MPa。用二次插值P2(t)=100+20t+5t(t−1)预测t=1.5秒应力。已知真实应力函数为σ(t)=100+20t+5t2,则应力预测值的绝对误差是? {{ select(6) }}
- 0.0Mpa
- 5.0Mpa
- 7.5Mpa
- 2.5Mpa
7、线性变换T:R2→R2将基向量$\mathbf{e}_{1}=\left[\begin{array}{l}1 \\0\end{array}\right]$。映射为[31],将$\mathbf{e}_{2}=\left[\begin{array}{l}0 \\1\end{array}\right]$映射为[−12]。则向量$\mathbf{v}=\left[\begin{array}{l}4 \\3\end{array}\right]$周在T下的像为? {{ select(7) }}
- [12−2]
- [910]
- [811]
- [57]
8、向量组α1,α2,α3线性无关,已知$\beta_{1}=k_{1} \alpha_{1}+\alpha_{2}+k_{1} \alpha_{3}$,$\beta_{2}=\alpha_{1}+k_{2} \alpha_{2}+\left(k_{2}+1\right) \alpha_{3}$,β3=α1+α2+α3,若β1,β2,β3线性相关,则k1,k2的值为() {{ select(8) }}
- k1=1且k2=0
- k1=1或k2=1
- k1=1且k2=1
- k1=1或k2=0
9、设随机变量X的概率密度函数为f(x)=b−a1a(a≤x≤b),其他情况为0。该分布是: {{ select(9) }}
- 正态分布
- 指数分布
- 泊松分布
- 均匀分布
10、给定向量 $\mathbf{u}=\left[\begin{array}{l}2 \\-1\\3\end{array}\right]$,$\mathbf{v}=\left[\begin{array}{l}4 \\0\\-2\end{array}\right]$,矩阵 A=uvT,则A的第2行第3列元素是?(行号列号从1开始计数) {{ select(10) }}
- 0
- 2
- 6
- -4
11、你正在使用一个机器学习模型来解决一个分类问题,在训练集上得到了非常高的准确率,但是在测试集上的准确率却相对较低。这种情况最有可能是以下哪种现象? {{ select(11) }}
- 欠拟合
- 过拟合
- 无法判断
- 正好拟合
12、在进行特征工程时,我们经常会对特征进行标准化处理。假设有一个特征X,其期望E[X]=10,方差Var(X)=4。现在我们对其进行线性变换得到新特征Y=3X-5。那么新特征Y的方差Var(Y)是多少? {{ select(12) }}
- 12
- 7
- 36
- 31
13、在使用 PCA(主成分分析)进行降维时,主要依据以下哪一项来选择主成分? {{ select(13) }}
- 主成分的方差贡献率
- 数据的类别分布
- 样本的分布密度
- 特征之间的相关性
14、关于线性变换 T:Rn→Rm,以下说法正确的是? {{ select(14) }}
- T(cu)=cT(u) 对所有标量 c 和向量 u 成立
- 零向量映射不一定为零向量
- 线性变换不能改变向量的维度
- T(u+v)=T(u)+T(v) 仅当 u⊥v 时成立
15、关于transformer解码器的描述错误的是? {{ select(15) }}
- 解码器额外使用编码器-解码器交叉注意力层(Cross-Attention)
- 解码器包含掩码自注意力层(Masked Self-Attention)
- 第二个 Multi-Head Attention 层的K,V矩阵使用 Encoder 的编码信息矩阵进行计算
- 解码器的第二个Multi-Head Attention采用了Masked掩码操作
多选题(16–20)
16、在 EM 算法中,GMM的 M-step 的解析解需要 {{ multiselect(16) }}
- 各成分权重和为 1
- 必须对角协方差
- 协方差矩阵正定
- 均值更新为加权平均
17、下列关于线性变换的说法中,正确的是() {{ multiselect(17) }}
- 若 T:Rn→Rm 是线性变换,则对于任意向量 α,β∈Rn 和常数 k,m∈R ,有 T(kα+mβ)=kT(α)+mT(β)
- 若 T1,T2 均为 T:Rn→Rm 的线性变换,则它们的和 T(x)=T1(x)+T2(x) 仍是线性变换
- 设T:R3→R2 是讲向量 xyz映射为 $\left[\begin{array}{l}x+y+1 \\z-2y\end{array}\right]$的变换,则 T 是线性变换
- 设T:R2→R2 是讲向量 [xy]映射为 $\left[\begin{array}{l}2x+y \\x-3y\end{array}\right]$的变换,则 T 是线性变换
18、设 {N(t),t≥0} 是强度为 λ 的泊松过程。以下陈述中,正确的是 {{ multiselect(18) }}
- 在区间 [0,t] 内事件数 N(t) 的均值为 λt
- 已知在时间 [0,t] 内发生了 n 个事件,那么这 n 个事件的发生时刻在 [0,t] 上是独立同分布的均匀分布
- 时间间隔 T1 (首次事件到达时间) 服从参数为 λ 的指数分布
- 两次连续事件的时间间隔 T2−T1 与 T1 相互独立
19、关于深度学习中的激活函数 ReLU、Softmax、Sigmoid 和 Tanh,以下描述正确的是: {{ multiselect(19) }}
- Tanh 函数的输出值范围在 [−1,1] 之间,常用于隐藏层的激活函数。
- Sigmoid 函数的导数在输入为 0 时达到最大值,随着输入值的增大或减小而逐渐减小。
- Softmax 函数将输入值归一化为概率分布,所有输出值的和为 1 。
- ReLU 函数在输入为负时输出为零,而在输入为正时输出为输入值本身。
20、与大语言模型(LLM)相比,以下哪些是多模态大语言模型(MLLM)在处理多模态输入时面临的独特挑战? {{ multiselect(20) }}
- 多模态数据的对齐(如图像与文本的语义对齐)
- 跨模态的语义理解与生成
- 多模态输入的实时处理与推理延迟
- 模型参数量的爆炸式增长