讲个我亲眼见证的事。
我们公司财务有个小姐姐,每个月要处理上百份合同。合同都是PDF格式的,里面有金额、日期、付款方、开户行这些信息。
她的工作是这样的:**打开PDF,复制金额,粘贴到Excel,打开下一个,复制金额,粘贴到Excel……**
一天下来,眼睛都花了。
后来她实在受不了了,找我问有没有办法。
我帮她弄了一套自动提取的流程,现在她做这个工作**从每天3小时缩短到40分钟**,而且不用加班了。
—
## 痛点在哪里
先说清楚问题在哪儿。
财务小姐姐的工作本质上是在做**信息搬运**:把PDF里的结构化信息,搬到Excel里去。
这件事技术上一点都不难,就是**重复性太高**。一个人做100次,99次是在做同样的动作,只有1次是真正需要动脑的。
而且这种工作特别容易出错。人做重复性工作,注意力会下降,到后面复制的金额可能就粘错了行。
我们之前就出过这种事,一个小数点点错了,核对了两天才发现。
—
## 怎么解决的
思路很简单:**让工具去读PDF,把数据提取出来,直接写进Excel**。
分三步走。
**第一步,确认PDF的格式。**
这一步很重要,但很多人会忽略。
你得先看看你们的合同PDF是哪种情况:
– **格式固定的**:每份合同的金额、日期都在同一个位置,提取规则可以通用。这种最简单。
– **格式不固定的**:不同合同排版不一样,有的左边放金额,有的右边放金额。这种需要更复杂的处理,但也不是不能做。
财务小姐姐的合同属于第一种,合同模板是统一的,只是内容不同。这种做自动化最合适。
**第二步,定义提取规则。**
比如:
– 合同编号:第X行第Y个数字段
– 金额:在”合同金额:”后面,数字+单位
– 签约日期:第X段中的日期格式内容
把这些规则写好,工具就知道该去哪里抓数据了。
**第三步,批量处理,输出Excel。**
一次处理几十份PDF,提取的数据直接写进Excel表格,每个字段一列,清清楚楚。
处理完之后,你打开Excel检查一遍就行,不用再逐个复制粘贴了。
—
## 她用了之后怎么说
财务小姐姐原话:
“以前我每天上午都在搞合同,搞到11点才勉强弄完。现在我9点到公司,把文件扔进去,泡杯咖啡,回来就差不多了。”
她还说了一个细节:**以前做这个工作特别烦躁**,一直重复复制粘贴,看文件看到头疼。现在虽然还是做这个工作,但省下来的时间可以处理别的,或者干脆休息一下。
工作效率高了,人也没那么累了。
—
## 踩过的坑
**坑1:PDF是扫描件,文字读不出来。**
有些老合同是扫描版,文字是一张图片,不是真正的文本。这种直接OCR处理,需要先转成图片再识别文字,稍微麻烦一点。
建议:**以后签合同尽量用电子版**,方便存档也方便后续处理。
**坑2:金额格式不统一。**
有的合同写”¥100,000″,有的写”10万元”,有的写”100000元”。这种需要额外处理一下,做个统一格式的转换。
**坑3:Excel表格格式要调。**
自动提取出来的表格可能比较朴素,需要手动调整一下列宽、加个表头颜色什么的。这是小活,但别忘了做,不然发给别人看起来不专业。
—
## 适合哪些场景
不是所有PDF都值得这样做。
**适合:**
– 合同量大,每月几十份以上
– PDF格式相对固定
– 要把数据录入系统或者做统计汇总
**不太适合:**
– 只有几份合同,手动复制也不慢
– PDF排版太乱,提取规则很难定义
– 数据后续不需要统计,只是一次性查看
—
## 小结
核心就一点:**把”复制粘贴”这个动作自动化掉**。
你花1小时设置好规则,以后每次处理合同就是点一下按钮的事。省下来的时间干什么不好?
财务小姐姐现在每天心情都好多了,毕竟谁也不想天天做重复性的体力活。
—
你们工作中有没有类似的”复制粘贴”型重复工作?有多少份合同或者文件要处理?评论说说,我帮你看看适不适合做自动化。

