1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

题解思路

  1. 拆数据:把训练集按标签分成两类,取出特征和标签。
  2. 求中心:算两类的平均向量,表示各自的“中心点”。
  3. 算散度:累加每类点相对中心的偏差,得到类内散度矩阵,并加一点正则防止不可逆。
  4. 求方向:解线性方程得到最佳投影方向 w,让两类在这条线上分得更开。
  5. 预测:把测试点投到这条线上,看它更接近哪一类中心,就判哪一类。

P3517.第2题-线性判别分析

    1000ms Tried: 93 Accepted: 23 Difficulty: 5 所属公司 : 美团
    算法与标签>机器学习算法

题目内容

在仅使用 numpy/pandasnumpy/pandasnumpy/pandas 的前提下,手写实现 FlsherFlsherFlsher 线性判别分析 (Linear Dscrimlnant Analysis, LDA) 用于二分类;并对调试样本输出预测标签。

1.读取数据

  • train:二维列表;最后一列为标签 y∈[0,1]y∈[0,1]y∈[0,1],前mmm 列为数值待征,m≥1m≥1m≥1

  • test:二维列表;仅含特征,与训练集同维度

2.参数估计

设

  • 类别均值 μc=1Nc∑vi=cXiμ_c=\frac{1}{N_c}\sum_{v_i=c}X_iμc​=Nc​1​∑vi​=c​Xi​

  • 类内散度矩阵 SW=∑c=01∑vi=c(Xi−μc)(Xi−μc)TS_W=\sum^1_{c=0}\sum_{v_i=c}(X_i-μ_c)(X_i-μ_c)^ΤSW​=∑c=01​∑vi​=c​(Xi​−μc​)(Xi​−μc​)T

为避免奇异,使用 SWreg=SW+10−6IS^{reg}_W=S_W+10^{-6}ISWreg​=SW​+10−6I

3.投影向量

W=(SWreg)−1(μ1−μ0)W=(S^{reg}_W)^{-1}(μ_1-μ_0)W=(SWreg​)−1(μ1​−μ0​)

4.分类准则

将样本投影到一维:z=WTX0z=W^ΤX^0z=WTX0

计算训练集中两类投影均值 m0,m1m_0,m_1m0​,m1​。

对任一样本 xxx ,预测规则固定为

yˊ=ý=yˊ​={1,∣z−m1∣<∣z−m0∣1,∣z-m_1∣<∣z-m_0∣1,∣z−m1​∣<∣z−m0​∣}

yˊ=ý=yˊ​={0,otherwise0,otherwise0,otherwise}

(即“谁更近选谁”,可消除 WWW 方向符号的不确定性。)

输入描述

标准输入仅 111 行 JSONJSONJSON ,示例

{

"train":[[1,1,0]],

​ [1.1,1.2,0],

​ [5,5,1],

​ [5.2,5.1,1]],

"test":[[1,1]],

​ [5,5]]

}

  • 训练集 n≥4n≥4n≥4 ,列数 m≥1m≥1m≥1
  • 所有数值为整数/浮点数,无空行

输出描述

仅输出一行:

[0,1]1[0,1]1[0,1]1

  • 长度等于测试样本数
  • 合法 JSONJSONJSON ,逗号后加空格

补充说明

1.正则项 10−6I10^{-6}I10−6I 必须加入 SWS_WSW​ 对角以避免奇异

2.为确保通过测试用例,仅使用 numpy/pandasnumpy/pandasnumpy/pandas

样例1

输入

{"train":[[1,1,0],[1.1,1.2,0],[5,5,1],[5.2,5.1,1]],"test":[[1,1],[5,5]]}

输出

[0, 1]

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 3, 71ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?