1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

模型与目标

  • 线性部分:O=XW+bO=XW+bO=XW+b,其中 X∈RN×nX\in\mathbb{R}^{N\times n}X∈RN×n、W∈Rn×kW\in\mathbb{R}^{n\times k}W∈Rn×k、b∈R1×kb\in\mathbb{R}^{1\times k}b∈R1×k。

  • 概率:PPP=softmax(O)\mathrm{softmax}(O)softmax(O),对每行做 (减去按行最大值做数值稳定)。

  • 损失(带 L2L_2L2​ 正则):

  • 梯度:

P3719.第3题-数据中心水温调节档位决策

    1000ms Tried: 2424 Accepted: 94 Difficulty: 6 所属公司 : 华为
    算法与标签>机器学习算法

题目内容

数据中心的机房需要散热,一般通过水冷系统调控机房的温度。出于节能的目的,需要收集数据中心最近一段时间的业务负裁,同时结合历史信息,外界气温、湿度等因素调高或调低冷机的出水温度。

逻辑回归是比轻量的模型,其输出 000 或 111 可以分别表示调低或调高温度。

在实际使用场景中,仅判断调低或调高不能满足业务要求,需要细化到调低 111 度、调高 0.50.50.5度、维持不变、调高 0.50.50.5 度、调高 111 度等不同的"档位"。

因此,可以对逻辑回归进行改造,将其输出更改为 softmaxsoftmaxsoftmax 可满足要求。

请根据提供的观测数据,训练改造后的模型,并根据给定样本数据预测调节的档位。

优化后的模型:O=XW+b,P=softmax(O)O=XW+b,P=softmax(O)O=XW+b,P=softmax(O)。

X∈R(m,n)X∈R(m,n)X∈R(m,n) 表示 mmm 条样本,每个样本有 nnn 个特征;

W∈R(n,k)W∈R(n,k)W∈R(n,k) 为权重;kkk 是档位数(即 kkk 个分类);

b∈R(1,k)b∈R(1,k)b∈R(1,k) 为偏置。WWW 和 bbb 通过训练得到。

P∈R(m,k)P∈R(m,k)P∈R(m,k) 表示预测的概率,取概率最大的作为输出档位。

输入描述

1.第一行是数据 schemaschemaschema,分别表示特征数 nnn ,分类数 kkk ,第 000 类样本数(即档位 000 ),第 111 类样本数,…,,…,,…,第 k−1k-1k−1 类样本数,待预测样本数 mmm ;数据均为 intintint 类型

2.后续的多行是 kkk 个分类的训练样本(按照分类 000 的多条样本、分类 111 的多条样本 、…、…、… 依次排列,一行一个样本)和 mmm 条待预测样本(一行个样本);数据均为 floatfloatfloat 类型

输出描述

每个待预测样本所所属的分类,一行输出一个样本的预测结果

样例1

输入

2 3 2 3 2 3
9 95
33 53
53 55
69 21
68 31
70 85
80 83
25 70
45 30
79 86

输出

0
1
2

说明

1.第一行数据 222 333 222 333 222 333 ,表示每条样本 222 个特征,共有 333 个分类;分类 000 样本 222 条,分类 111 样本 333 条,分类 222 样本 222 条;测试用例 333 条

2.第 222~333 行为分类 000 样本(标签为 000 ),444~666 行为分类 111 样本(标签 111 ),777~888 行为分类 222 样本(标签为 222 )

3.最后 333 行是待预测样本

输出:333 个待预测样本的预测结果为分类 000 、分类 111 、分类 222

样例2

输入

3 3 4 3 4 5
9 95 7
33 53 13
45 43 6
40 50 11
53 55 36
69 21 55
68 31 43
70 85 23
80 83 46
70 73 55
76 78 53
25 70 6
20 69 16
45 30 50
79 86 51
70 76 36

输出

0
0
1
2
2

说明

1、第一行数据 333 333 444 333 444 555 ,表示每条样本 333 个特征,共有 333 个分类;分类 000 样本 444 条,分类 111 样本 333 条,分类 222 样本 444 条;测试用例 555 条

2.第 222~555 行为分类 000 样本(标签为 000),666~888 行为分类 111 样本(标签 111 ),999~121212 行为分类 222 样本(标签为 222 )

3.最后 555 行是待预测样本

输出:

555 个待预测样本的预测结果为分类 000 (即档位 000 )、分类 000 、分类 111 、分类 222 、分类 222

提示

1.使用交叉熵损失函数,标签值需转为 one−hotone-hotone−hot 编码;梯度求解函数如下方公式所示,YYY 为真实标签(即 one−hotone-hotone−hot 编码);PPP 为预测的概率(即 softmaxsoftmaxsoftmax 的输出)

2.采用批梯度下降优化参数;选择比较好的学习率(根据经验,为了加快收敛速度,初始学习率可设置较大的数值,例如 555 );适当增加迭代次数有助于获得更精确的结果;

3.原始数据值域一般在 100100100 以内,为避免计算 softmaxsoftmaxsoftmax 越界,需要对数据集执行归一化操作。

交叉熵函数

−1m∑i=1m∑j=1kYi,jlog⁡(Pi,j)-\frac{1}{m} \sum_{i=1}^{m} \sum_{j=1}^{k} Y_{i, j} \log \left(P_{i, j}\right)−m1​∑i=1m​∑j=1k​Yi,j​log(Pi,j​)

损失函数对 WWW 的梯度

1mXT(P−Y)\frac{1}{m} X^{T}(P-Y)m1​XT(P−Y)

损失函数对 bbb 的梯度

1m∑i=1m(Pi,:−Yi,:)\frac{1}{m} \sum_{i=1}^{m}\left(P_{i,:}-Y_{i,:}\right)m1​∑i=1m​(Pi,:​−Yi,:​)

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 2, 74ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?