#P3551. 第1题-选择题

第1题-选择题

单选题(1–15)

1、某工厂生产的产品次品率为0.020.02,随机抽取100100件产品,次品数X 近似服从的分布是? {{ select(1) }}

  • 伯努利分布
  • 均匀分布
  • 泊松分布
  • 正态分布

2、在文本生成中,以下哪种模型最适合用于生成连贯的长文本 {{ select(2) }}

  • 最大熵模型
  • 决策树
  • LSTMLSTM
  • 隐马尔可夫模型(HMM)(HMM)

3、在计算某天线的安装角度时,需要求解如下非线性方程 x=cosxx=cosx

工程师小王打算使用迭代公式

xk+1=cos(xk)x_{k+1}=cos(x_k)

进行数值计算。以下有关该迭代收敛性的说法中,哪一项是正确的? {{ select(3) }}

  • 对任意初始值,该算法都能收敛到其唯一实根
  • 该算法是不稳定的,因为余弦函数有界,而线性函数无界
  • 该方程有两个实根,算法收敛到哪一个取决于初始值
  • 当算法收敛时,收敛速度是二次的

44、下述检验正态性假设的方法中错误的是 {{ select(4) }}

  • 直方图方法
  • 拟合优度检验方法
  • T检验
  • 使用偏度系数和峰度系数

5、用牛顿迭代法求函数(x+3)x2(x+3)x^2=0 的根,初值为 x0=3x_0=3 的情况下,其收敛速度是 {{ select(5) }}

  • 二次收敛
  • 对数收敛
  • 线性收敛
  • 超线性收敛

6、桥梁应力监测中,传感器测得:t=[0,1,2]t=[0,1,2]秒时σ=[100,120,150]MPa\sigma=[100,120,150]MPa。用二次插值P2(t)=100+20t+5t(t1)P_2(t) =100 +20t +5t(t-1) 预测t=1.5t=1.5秒应力。已知真实应力函数为σ(t)=100+20t+5t2\sigma(t)=100+20t+5t^2,则应力预测值的绝对误差是? {{ select(6) }}

  • 0.0Mpa0.0 Mpa
  • 5.0Mpa5.0 Mpa
  • 7.5Mpa7.5 Mpa
  • 2.5Mpa2.5 Mpa

7、线性变换T:R2R2T:R^2→ R^2 将基向量$\mathbf{e}_{1}=\left[\begin{array}{l}1 \\0\end{array}\right]$。映射为[31]\left[\begin{array}{l}3 \\1\end{array}\right],将$\mathbf{e}_{2}=\left[\begin{array}{l}0 \\1\end{array}\right]$映射为[12]\left[\begin{array}{l}-1 \\2\end{array}\right]。则向量$\mathbf{v}=\left[\begin{array}{l}4 \\3\end{array}\right]$周在TT下的像为? {{ select(7) }}

  • [122]\left[\begin{array}{l}12\\-2\end{array}\right]
  • [910]\left[\begin{array}{l}9\\10\end{array}\right]
  • [811]\left[\begin{array}{l}8\\11\end{array}\right]
  • [57]\left[\begin{array}{l}5\\7\end{array}\right]

8、向量组α1\alpha_1,α2\alpha_2,α3\alpha_3线性无关,已知$\beta_{1}=k_{1} \alpha_{1}+\alpha_{2}+k_{1} \alpha_{3}$,$\beta_{2}=\alpha_{1}+k_{2} \alpha_{2}+\left(k_{2}+1\right) \alpha_{3}$,β3=α1+α2+α3\beta_{3}=\alpha_{1}+\alpha_{2}+\alpha_{3},若β1\beta_{1},β2\beta_{2},β3\beta_{3}线性相关,则k1,k2k_1,k_2的值为() {{ select(8) }}

  • k1=1k_1=1k2=0k_2=0
  • k1=1k_1=1k2=1k_2=1
  • k1=1k_1=1k2=1k_2=1
  • k1=1k_1=1k2=0k_2=0

9、设随机变量X的概率密度函数为f(x)=1baa(axb)f(x)=\frac{1}{b-a}a(a≤x≤b) ,其他情况为0。该分布是: {{ select(9) }}

  • 正态分布
  • 指数分布
  • 泊松分布
  • 均匀分布

10、给定向量 $\mathbf{u}=\left[\begin{array}{l}2 \\-1\\3\end{array}\right]$,$\mathbf{v}=\left[\begin{array}{l}4 \\0\\-2\end{array}\right]$,矩阵 A=uvTA=uv^T,则A的第2行第3列元素是?(行号列号从1开始计数) {{ select(10) }}

  • 0
  • 2
  • 6
  • -4

11、你正在使用一个机器学习模型来解决一个分类问题,在训练集上得到了非常高的准确率,但是在测试集上的准确率却相对较低。这种情况最有可能是以下哪种现象? {{ select(11) }}

  • 欠拟合
  • 过拟合
  • 无法判断
  • 正好拟合

12、在进行特征工程时,我们经常会对特征进行标准化处理。假设有一个特征X,其期望E[X]=10,方差Var(X)=4。现在我们对其进行线性变换得到新特征Y=3X-5。那么新特征Y的方差Var(Y)是多少? {{ select(12) }}

  • 12
  • 7
  • 36
  • 31

13、在使用 PCA(主成分分析)进行降维时,主要依据以下哪一项来选择主成分? {{ select(13) }}

  • 主成分的方差贡献率
  • 数据的类别分布
  • 样本的分布密度
  • 特征之间的相关性

14、关于线性变换 T:RnRmT:ℝ^n→ℝ^m,以下说法正确的是? {{ select(14) }}

  • T(cu)=cT(u)T(cu)=cT(u) 对所有标量 cc 和向量 uu 成立
  • 零向量映射不一定为零向量
  • 线性变换不能改变向量的维度
  • T(u+v)=T(u)+T(v)T(u+v)=T(u)+T(v) 仅当 uvu⊥v 时成立

15、关于transformer解码器的描述错误的是? {{ select(15) }}

  • 解码器额外使用编码器-解码器交叉注意力层(Cross-Attention)
  • 解码器包含掩码自注意力层(Masked Self-Attention)
  • 第二个 Multi-Head Attention 层的K,V矩阵使用 Encoder 的编码信息矩阵进行计算
  • 解码器的第二个Multi-Head Attention采用了Masked掩码操作

多选题(16–20)

16、在 EM 算法中,GMM的 M-step 的解析解需要 {{ multiselect(16) }}

  • 各成分权重和为 1
  • 必须对角协方差
  • 协方差矩阵正定
  • 均值更新为加权平均

17、下列关于线性变换的说法中,正确的是() {{ multiselect(17) }}

  • T:RnRmT:ℝ^n → ℝ^m 是线性变换,则对于任意向量 α,βRnα,β∈ℝ^n 和常数 k,mRk,m ∈ℝ ,有 T(kα+mβ)=kT(α)+mT(β)T(kα+ mβ)= kT(α)+ mT(β)
  • T1,T2T_1,T_2 均为 T:RnRmT:ℝ^n → ℝ^m 的线性变换,则它们的和 T(x)=T1(x)+T2(x)T(x)=T_1(x)+T_2(x) 仍是线性变换
  • T:R3R2T:ℝ^3 → ℝ^2 是讲向量 [xyz]\left[\begin{array}{l}x \\y\\z\end{array}\right]映射为 $\left[\begin{array}{l}x+y+1 \\z-2y\end{array}\right]$的变换,则 TT 是线性变换
  • T:R2R2T:ℝ^2 → ℝ^2 是讲向量 [xy]\left[\begin{array}{l}x \\y\end{array}\right]映射为 $\left[\begin{array}{l}2x+y \\x-3y\end{array}\right]$的变换,则 TT 是线性变换

18、设 {N(t),t0N(t),t≥ 0} 是强度为 λλ 的泊松过程。以下陈述中,正确的是 {{ multiselect(18) }}

  • 在区间 [0,t][0,t] 内事件数 N(t)N(t) 的均值为 λtλt
  • 已知在时间 [0,t][0,t] 内发生了 nn 个事件,那么这 nn 个事件的发生时刻在 [0,t][0,t] 上是独立同分布的均匀分布
  • 时间间隔 T1T_1 (首次事件到达时间) 服从参数为 λλ 的指数分布
  • 两次连续事件的时间间隔 T2T1T_ 2-T_1T1T_1 相互独立

19、关于深度学习中的激活函数 ReLU、Softmax、Sigmoid 和 Tanh,以下描述正确的是: {{ multiselect(19) }}

  • Tanh 函数的输出值范围在 [1,1][-1,1] 之间,常用于隐藏层的激活函数。
  • Sigmoid 函数的导数在输入为 00 时达到最大值,随着输入值的增大或减小而逐渐减小。
  • Softmax 函数将输入值归一化为概率分布,所有输出值的和为 11
  • ReLU 函数在输入为负时输出为零,而在输入为正时输出为输入值本身。

20、与大语言模型(LLM)相比,以下哪些是多模态大语言模型(MLLM)在处理多模态输入时面临的独特挑战? {{ multiselect(20) }}

  • 多模态数据的对齐(如图像与文本的语义对齐)
  • 跨模态的语义理解与生成
  • 多模态输入的实时处理与推理延迟
  • 模型参数量的爆炸式增长