y∈{0,1}
;中间前 5 列依次为特征:
写入次数、读取次数、平均写入延迟(ms)、平均读取延迟(ms)、设备使用年限(年)。
(若行里意外多出字段,取前 5 个数值作特征、最后一个作标签,兼容样例1)"NaN"
,视为缺失,用该列均值填充(仅用训练集估计)。在云存储系统中,需要预测存储设备故障以提前迁移数据。每条设备日志包含:
设备 ID ,写入次数,读取次数,平均写入延迟 (ms) ,平均读取延迟 (ms) ,设备使用年限(年),设备状态(0正常/1故障)
你需要实现一个设备故障预测系统。包含以下功能:
1、数据清洗: