1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

思路

感知机使用分类函数:

sign⁡(w⋅x+b) \operatorname{sign}(w \cdot x + b) sign(w⋅x+b)

对于样本 (xi,yi)(x_i, y_i)(xi​,yi​),若分类错误,则有:

P4933.第2题-感知机梯度下降实现

    1000ms Tried: 3 Accepted: 1 Difficulty: 5 所属公司 : B站
    算法与标签>机器学习算法

题目内容

某电商网站准备推广先用后买购物模式,经过调研,准备使用感知机对一部分用户进行过滤。

给定一个二维坐标下的训练数据集 T={(x11,x12),(x21,x22),…,(xn1,xn2)}T = \{(x_1^1,x_1^2),(x_2^1,x_2^2),\dots,(x_n^1,x_n^2)\}T={(x11​,x12​),(x21​,x22​),…,(xn1​,xn2​)},二分类标签取值范围 yi={1,−1},i=1,2,3...Ny_i = \{1,-1\}, i = 1,2,3...Nyi​={1,−1},i=1,2,3...N,使用感知机 sign(w⋅x+b)sign(w \cdot x + b)sign(w⋅x+b) 进行二分类,损失函数定义为错误分类点到超平面的总距离,其中输入空间中的任一点 x0x_0x0​ 到超平面的距离可以表示为: 1∣∣w∣∣∣w⋅x0+b∣\frac{1}{||w||}|w \cdot x_0 + b|∣∣w∣∣1​∣w⋅x0​+b∣ 其中 ∣∣w∣∣||w||∣∣w∣∣ 是 www 的 L2L2L2 范数。

对于错误分类的点,当 w⋅xi+b>0w \cdot x_i + b > 0w⋅xi​+b>0 时,yi=−1y_i = -1yi​=−1,当 w⋅xi+b<0w \cdot x_i + b < 0w⋅xi​+b<0 时,yi=1y_i = 1yi​=1,所以可以推出一个重要的结论: −yi(w⋅xi+b)>0-y_i(w \cdot x_i + b) > 0−yi​(w⋅xi​+b)>0 成立。

那么可以得到,所有错误分类的点到超平面的总距离为: −1∣∣w∣∣∑yi(w⋅xi+b)-\frac{1}{||w||}\sum y_i(w \cdot x_i + b)−∣∣w∣∣1​∑yi​(w⋅xi​+b)

进一步地,可以得到感知机的损失函数为: Loss(w,b)=−∑yi(w⋅xi+b)Loss(w,b) = -\sum y_i(w \cdot x_i + b)Loss(w,b)=−∑yi​(w⋅xi​+b)

请根据题目描述,结合输入和输出信息以及补充说明的提示,使用梯度下降法,完成对 w,bw,bw,b 的参数更新。

提示:

(1)需要根据随机梯度下降法推导出 w,bw,bw,b 的梯度下降表达式;

(2)根据损失函数的定义,每次迭代中,需要对所有样本进行遍历,但是分类正确的样本无需执行梯度下降,只有分类错误的样本执行。

(3)请认真阅读补充说明中的内容。

输入描述

输入是 222 个 listlistlist,第一个 listlistlist 是一个二维 listlistlist,用来表示训练数据,每个子 listlistlist 的最后一个元素表示二分类标签 yi={1,−1},i=1,2,3...Ny_i = \{1,-1\}, i = 1,2,3...Nyi​={1,−1},i=1,2,3...N,集合中的元素表示样本在二维坐标下的特征。第二个 listlistlist 表示训练感知机所需要的超参数,分别代表迭代次数和学习率。

输出描述

请给出在给定迭代次数和学习率下,使用随机梯度下降法对参数 w,bw,bw,b 的更新结果,返回值类型为 listlistlist,长度为 333(222 个 www 权重和 11 1 个 bbb 权重)

补充说明

(1)可以使用形如 numpy、pandasnumpy、pandasnumpy、pandas 等第三方 PythonPythonPython 库;

(2)为了简化计算难度,仅使用二维坐标下的数据点作为特征,并且 w,bw,bw,b 均初始化为 000;

(3)请注意,只有错误样本下会执行梯度下降,且 w,bw,bw,b 都最多保留小数点后 333 位;

(4)为了保证唯一性,请严格遵循输入输出描述进行作答。

(5)形如 sys.stdinsys.stdinsys.stdin 等方法结合 forforfor 循环和 evalevaleval 函数即可读取并还原输入数据。

样例1

输入

[[(1,2),1],[(3,4),-1]]
[20,0.1]

输出

[-0.5,0.2,0.7]

说明

输入第一个 listlistlist 是给定的训练数据和标签,第二个 listlistlist 是训练参数,输出是给定的迭代次数和学习率下的参数 w,bw,bw,b 更新结果。

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 0, 35ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?