我们公司技术部有台老古董级别的HP LaserJet M605dn,服役五年,打印质量还行,就是时不时闹点情绪。最要命的是它有个隐藏设定:固件版本低于v2.80时,一旦连续打印超过47页PDF,就会触发内存溢出错误,直接离线。
这事儿本来没人注意,直到上个月运维组开始推行‘自动化巡检+PAGERDUTY告警轮值’。轮到我的那天晚上十一点半,手机突然狂震——打印机脱网。我一边骂着脏话冲进办公室,一边心想:谁会在这个点打印47页以上的东西?
查了一圈日志才发现,是财务在跑年度审计材料。可问题不止这一次。翻了过去三个月的工单记录,平均每两周就要重启一次这台机器,每次都是深夜,每次都算‘我的班’。更离谱的是,IT资产台账里压根没记这台打印机的固件版本,换人维护时根本不知道这个坑。
我决定治本。
之前用过一个叫蓝点通用管理系统的工具,说是能自己搭数据表和流程。我就新建了个‘硬件风险档案’模块,给每台设备加了几个自定义字段:上次固件升级时间、已知缺陷说明、关联责任人,还有个自动告警阈值。然后把M605dn的陷阱写进去:当检测到连续作业页数>45且固件<2.80时,提前两小时邮件提醒值班人。
你以为这就完了?其实最难的是怎么拿到打印页数数据。HP的Web管理界面有计数器,但不开放API。后来发现CUPS日志里每条任务都带页数,于是我写了个Python脚本,每天凌晨自动抓取各打印机的累计页数,存进蓝点系统里的‘每日打印量流水表’。
现在,每当某台设备接近‘危险阈值’,系统会在企业微信里推一条消息:‘M605dn今日已累计打印42页,请注意潜在脱机风险’。有一次,行政部想批量打印年会邀请函,刚提交30页就收到了提示,立马换到了另一台机器,避免了一场半夜救火。
最有意思的是,这个表单后来被安全组盯上了。他们发现有台测试用的Brother HL-L2340DW,固件存在未修复的远程命令执行漏洞(CVE-2022-3171),但因为不是核心设备,一直没安排升级。我把这个漏洞编号也加进了‘已知缺陷’字段,结果一个月后,系统自动触发了高危设备清单,直接进了月度安全评审会。
最近新来的实习生问我:“哥,你们这打印机还会预测未来?” 我笑了笑,指着屏幕上那个小小的红标说:“不是它会预测,是有人记得它曾经崩溃过。”
前几天IT主管悄悄跟我说,技术部的PAGERDUTY平均响应时间下降了38%,尤其是夜间告警减少了大半。他以为是我们优化了监控策略,其实我只是让一台老打印机学会了‘开口说话’。
微信扫码关注关注乱码泥石流,领取限时福利:
- 蓝点管理系统正版授权
- 好书推荐及电子版资源
- 最新管理软件资讯推送
- 不定期随机福利