当前,OCR已在各行各业的信息录入、审核、电子化、归档管理等场景中得到了普遍应用。企业对信息抽取的精度、版式覆盖全面性、迭代速度与灵活度等也随之有了更高的要求。尤其是对于业务流程中需要处理大量种类繁多的定制文档、不固定版式单证的企业而言,范围有限的常规证件、发票的信息识别与抽取模型已经无法满足业务需求。
越来越多的企业开始尝试采用自主研发或定制开发文档信息抽取模型的方式,以满足个性化的文档识别需求。但是,自主研发需要从零起步组建团队,人力成本高,需要攻克大量技术难题,模型可用性难以保证;定制开发模型则面临着“一种版式对应一个模型”导致定制成本高、驻场开发定制周期长、无法自主迭代、泛化能力差、易重复采购、业务数据保密性要求高等诸多困难。
合合信息推出文字识别训练平台,基于合合信息的深度学习算法和能力,为有自主定制开发文档信息识别、抽取、分类模型需求的企业提供低代码、自动化的一站式OCR开发平台。零算法基础开发者与实际业务人员,通过简单操作即可自主完成模型训练开发全流程。
合合信息文字识别训练平台内置了场景丰富的算法模型,配备了信息抽取(锚点)、信息抽取(K-V)、信息抽取(NLP)、信息抽取(长文本)、分类识别五大模型类型,以满足固定版式、半固定版式、不固定版式的单页与多页文档的信息抽取与分类需求,根据文档特点创建适配的模型类型,有效提升识别精度,降低模型训练难度。
客户案例:
某上市城商行多部门有大量的标准证照、固定或不固定版式凭证、银行交易流水、财报等识别需求,文档包含印刷体与手写体,中、英等多种语言。行内还需要根据业务拓展需求与监管要求,快速响应,新增更多类型的证照识别能力,自主建模识别新类型的票据、报表等。
该城商行与合合信息合作,私有化部署了合合信息文字识别训练平台,通过自主模型创建、训练、部署上线与持续迭代,满足了身份证、银行卡、驾驶证、行驶证、结婚证、户口本、房产证等证件识别,现金支票、转账支票、进账单、存单、结算业务申请书、代发工资流水等业务凭证识别,增值税专用发票、增值税普通发票、火车票、出租车票、定额发票、机动车销售统一发票等票据识别,以及财报识别分析、证照风险检测等多业务场景需求,赋能集中作业中心、运营管理部、风险管理部、小企业信贷中心、财务企划部等行内部门。并且,仅需要一位运维人员,即可实现对行业OCR服务的统一管理。
同时,合合信息助力该城商行搭建数据回流交换平台连接集中作业平台与文字识别训练平台,将实际业务中产生的标注数据回流至文字识别训练平台,不断迭代优化模型,提升模型抽取精度,赋能全业务条线高效智能审核。
即刻咨询,获取您的专属解决方案
