1. Job Roadmap
  2. Home
  3. Problem Set
  4. codenotelist
  5. Forum
  6. course
  7. Shore Share Sessions
  8. Record
  1. Login
  2. Sign Up
  3. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
    ZhContent TextSol AI分析

解题思路

  • 将每条样本的“特征序列”看成由大写字母 A~G 组成的集合。按固定顺序 A B C D E F G 做 one-hot 编码:只要某个字母在序列中出现(次数不计),对应位置记为 1,否则为 0,得到长度为 7 的特征向量。
  • 训练一个单层逻辑回归(Logistic Regression) 分类器: 预测值 p = sigmoid(w·x + b);损失函数采用交叉熵;用**梯度下降(SGD,batch=1)**更新参数。题面给定超参:学习率 0.1,训练轮数 20,初始 w、b 全为 0。
  • 预测阶段:对测试数据计算 p,阈值 0.5 二值化,p>0.5 输出 1,否则输出 0。
  • 读入格式:第一行 N M;接着 N 行为训练样本(“字符串 标签”);之后 M 行为仅含字符串的测试样本;输出 M 行预测标签。

复杂度分析

P3872.第3题-基于逻辑回归的意图分类器

    1000ms Tried: 1775 Accepted: 540 Difficulty: 4 所属公司 : 华为
    算法与标签>机器学习算法

题目内容

意图分类是一种常见的 NLPNLPNLP 任务,现在需要实现一个基于逻辑回归的意图分类系统(二分类)。本系统的输入是一个已处理的特征序列,输出是意图标签 ( 000 或 111 )。请根据以下步骤实现该分类器:

1、数据预处理:对输入(特征序列,即仅包含大写字母 ABCDEFGABCDEFGABCDEFG 的序列)进行 one−hotone-hotone−hot 编码,编码时的特征顺序是 ABCDEFGABCDEFGABCDEFG;某个特征存在取 111 ,不存在取 000 ;

2、模型初始化:构造一个单层的训练网络,初始化权重 www 和偏置 bbb 初始化的值全部设为 000 ;

3、模型训练:使用 SigmoidSigmoidSigmoid 函数计算预测值,使用交叉熵损失函数训练,使用梯度下降算法更新参数;训练过程中使用训练数据进行训练,相关超参数为:学习率 0.10.10.1,训练轮数 202020 ,batchbatchbatch 大小为 111 ;

(1)SigmoidSigmoidSigmoid 函数公式:

σ(z)=11+e−zσ(z)=\frac{1}{1+e^{-z}}σ(z)=1+e−z1​ ,其中 z=w⋅x+bz=w·x+bz=w⋅x+b ( xxx 为输入特征向量)。

4.模型预测:对测试数据进行预测,首先使用 sigmoidsigmoidsigmoid 函数计算预测值,然后做二值化处理(大于 0.50.50.5 认为是类别 111 ,否则是类别 000 )

输入描述

第一行输入 NNN 和 M,N(10<=N<=100)M,N(10<=N<=100)M,N(10<=N<=100) 表示训练数据条数,M(2<=M<=10)M(2<=M<=10)M(2<=M<=10) 表示测试数据条数;

接下来 NNN 行是训练数据,每行包含两部分内容(空格隔开),即代表输入的特征序列(由大写字母 ABCDEFGABCDEFGABCDEFG 构成的字符串,长度范围是 [3,7][3,7][3,7] )和该条数据的意图标签(使用数字 000 或 111 表示);

在接下来 MMM 行是测试数据的特征序列。

输出描述

输出有 MMM 行,每行是测试输出,即用数字 000 或 111 表示的意图标签。

样例1

输入

10 2
CBG 0
AFE 0
FGD 1
BFG 0
BBA 0
BDD 0
BEG 1
EGE 0
CAF 0
DGD 1
DBA
DAD

输出

0
0

说明

该样例有 101010 条训练数据,222 条测试数据,222 个测试输出均 000

样例2

输入

10 3
GDEE 0
BDFEA 1
BDFE 0
GECD 0
DDCEE 1
ADA 0
EECBC 0
BACBC 1
DDD 1
FEEEE 0
AADC
BBAE
ECEC

输出

1
0
0

说明

该样例有 101010 条训练数据,333 条测试数据,测试输出分别为 1、0、01、0、01、0、0 。

登录后即可使用 AI 分析。

模式
倒计时时长
:

最长 10 小时 59 分;应用后按此时长重新开始。

提示:点击提交记录在左侧题面区域查看详情
题库
AI分析设置
留空使用官方API Key,每天有次数限制(自定义API Key仅限会员和管理员使用,不限次数)
会员和管理员可切换模型;切到 Kimi/智谱/通义/豆包时需填写对应供应商 API Key
升级会员,可将运行与提交冷却时间缩短至 1 秒起

Status

  • Judging Queue
  • Service Status

Development

  • Open Source

Support

  • Help
  • Contact Us

About

  • About
  • Privacy
  • Terms of Service
  • Copyright Complaint
  1. Language
    1. English
    2. 한국어
    3. 简体中文
    4. 正體中文
  2. Legacy mode
  3. Theme
    1. Light
    2. Dark
  1. 京ICP备2025123107号-1
  2. Worker 0, 54ms
  3. Powered by Hydro v5.0.0-beta.18 Community
CLOSE


ScanQRCodePrompt

请使用微信扫描下方二维码完成注册

Forgot password or username?