上周五下午四点十七分,小陈在财务部工位上第三次点开同一张PDF发票——不是为了核对金额,而是盯着它发呆。这张票是市场部王工上周五提交的差旅报销单附件,金额586元,开票日期2024年4月22日。小陈记得清清楚楚:三天前,IT部老周也报过一笔586元的同酒店同日期住宿费,当时她手动比对时还顺手在Excel里标了黄。结果今天系统又弹出一张一模一样的PDF,连页眉右下角那个模糊的‘副本_02’水印都分毫不差。
这不是偶然。上个月底盘点时,她悄悄拉了份数据:近90天内,部门共收到电子发票附件2174份,其中肉眼可辨的重复提交有47次,但真正被系统拦截的——0次。
财务系统自带的发票查重,只认税号+发票代码+发票号码三字段,而现实是:供应商习惯批量导出PDF,把10张票塞进一个文件;销售同事爱用手机拍发票,横着拍、反光拍、带手指入镜拍,OCR识别后代码常错一位;更别说有人把同一张票分别扫成PDF和JPG再各传一次……系统根本没看见‘它其实是同一张纸’。
小陈没去写流程优化建议,也没等IT排期。她打开蓝点通用管理系统,新建了一个叫‘发票指纹快照’的数据模型:
- 字段1:原始文件哈希值(自动计算)
- 字段2:OCR提取的税号+代码+号码(带容错清洗,比如自动去掉空格、替换全角数字)
- 字段3:关键视觉特征摘要(调用内置轻量图像比对,不依赖文字)
- 字段4:关联报销单ID + 提交人 + 时间戳
然后她拖拽配置了一个‘上传即校验’流程:任何人在报销单附件栏上传文件,系统自动跑这三项比对;任一命中近30天内已存记录,立刻在附件旁打上红色感叹号,并弹出提示:“该发票影像与[王工/4.22/XX酒店]记录高度相似,是否确认为不同业务?”
第二天上午,市场部小李上传报销单时,刚拖完PDF,感叹号就跳了出来。他愣了两秒,点开提示里带链接的原单,才想起来——那张票自己上周填错预算科目,删掉重填时忘了删附件。
第三天,采购部老张试传一张新扫描件,系统没拦。他截图发给小陈:“是不是没生效?”小陈回:“你这张是昨天刚开的新票,哈希和特征都新鲜。”老张回了个“OK”表情,末了加一句:“不过你这个‘指纹’,比我们上次买的某大厂发票识别SaaS便宜十倍,还没锁死我只能报差旅。”
其实小陈没告诉别人,她连‘发票指纹’这个词都是现查的。起名时翻管理类公众号,看到一篇讲生物识别误识率的文章,顺手抄了‘指纹’俩字。真正让她坚持配完这个流程的,是上周发现行政部小杨用同样模型管起了《供应商廉洁承诺书》的签字页比对——不是防造假,是防漏签。因为去年有家合作方的承诺书,法务说少了一处法人签名,对方咬定“我们签了”,最后靠蓝点里存的原始扫描页哈希值对上了时间戳,才没扯皮。
现在财务部共享屏右下角挂着个小窗口,实时滚动着今日‘疑似重复影像’计数。数字不大,多数时候是0。但小陈说,最让她安心的不是拦截了多少张,而是当新人第一次上传就被提醒时,那种“原来这事真能被看见”的松一口气。
上周五下班前,她顺手导出了本月‘发票指纹’匹配日志。一共183次触发,其中142次是同一人短时间重复上传(删单重填、格式试错),37次是跨人跨部门撞车。她没群发报告,只把37次跨部门的整理成一页纸,贴在茶水间公告板上,标题写着:“以下发票,可能需要你们一起看看——谁住的?谁付的?谁该销账?”
底下没人留言。但第二天,IT部老周主动来找她,问能不能把‘指纹’模型复制一份,用来管他们服务器变更申请里的截图附件。他说:“上回生产库慢,运维和DBA各交了三张性能监控图,长得像双胞胎,吵了两天。”
微信扫码关注关注乱码泥石流,领取限时福利:
- 蓝点管理系统正版授权
- 好书推荐及电子版资源
- 最新管理软件资讯推送
- 不定期随机福利